Рейтинг Рынка
24ч
5704
Активные криптовалюты
54.83%
Bitcoin Поделиться

«Т-банк» выложил LLM на 32 млрд параметров в открытый доступ

«Т-банк» выложил LLM на 32 млрд параметров в открытый доступ


Forklog
2024-12-11 10:33:20

«Т-банк» открыл доступ к двум большим языковым моделям (LLM) T-Pro и обновленной версии T-Lite. Об этом пишут «Ведомости» со ссылкой на представителя банка. Профессиональная версия нейросети обладает 32 млрд параметров, T-Lite — 7 млрд. Вторую представили в июле 2024 года.  Количество параметров отражает способность модели учитывать больше контекста, лучше запоминать информацию и давать точные ответы. Для сравнения, у Llama 3.1 405B от Meta 405 млрд параметров, у Large 2 от французского стартапа Mistral — 123 млрд. Открытый доступ к T-Pro и T-Lite позволит бизнесу бесплатно применять нейросети для решения внутренних задач и создавать новые продукты на базе разработанных моделей. В пример «Ведомости» привели умные чат-боты для службы поддержки и ассистентов для сотрудников вроде инструментов по написанию кода, составления отчетов или исследований. Представленные модели входят в семейство LLM Gen-T, предназначенное для решения узкоспециализированных задач. Этим они отличаются от ChatGPT, который универсален. T-Lite и T-Pro созданы на базе Qwen-2.5 от китайского разработчика Alibaba Group и адаптированы под русский язык. «Такой подход позволяет “Т-технологиям” существенно сократить затраты на создание больших языковых моделей — на 80–90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic», — отметил представитель банка. Бизнес может запустить языковые модели на своих серверах и дообучить под конкретный кейс, подчеркнул CEO Dbrain Алексей Хахунов. Напомним, в декабре в России представили виртуального ассистента на базе ИИ для психологов, который в два раза повышает продуктивность, качество услуг и выручку. В том же месяце российские ученые презентовали новую открытую среду XLand-MiniGrid, которая предназначена для разработки алгоритмов контекстного обучения с подкреплением — отдельного направления в ИИ-исследованиях.


script type="text/javascript"> atOptions = { 'key' : '2a29386f0570b10dd6817f8b71218348', 'format' : 'iframe', 'height' : 250, 'width' : 300, 'params' : {} }; document.write('');
Прочтите Отказ от ответственности : Весь контент, представленный на нашем сайте, гиперссылки, связанные приложения, форумы, блоги, учетные записи социальных сетей и другие платформы («Сайт») предназначен только для вашей общей информации, приобретенной у сторонних источников. Мы не предоставляем никаких гарантий в отношении нашего контента, включая, но не ограничиваясь, точность и обновление. Никакая часть содержания, которое мы предоставляем, представляет собой финансовый совет, юридическую консультацию или любую другую форму совета, предназначенную для вашей конкретной опоры для любых целей. Любое использование или доверие к нашему контенту осуществляется исключительно на свой страх и риск. Вы должны провести собственное исследование, просмотреть, проанализировать и проверить наш контент, прежде чем полагаться на них. Торговля - очень рискованная деятельность, которая может привести к серьезным потерям, поэтому проконсультируйтесь с вашим финансовым консультантом, прежде чем принимать какие-либо решения. Никакое содержание на нашем Сайте не предназначено для запроса или предложения