«Яндекс» представил крупнейшую нейросеть для обработки текстов со 100 млрд параметров
«Яндекс» представил крупнейшую нейросеть для обработки текстов со 100 млрд параметров
Российская IT-компания «Яндекс» выложила в интернет код YaLM 100B — нейросети для генерации и обработки текстов на русском и английском языках. По информации «Яндекса», это самая большая русскоязычная нейросеть, опубликованная в свободном доступе. Об этом сообщила пресс-служба компании.
«YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире», — рассказали в пресс-службе «Яндекса».
Компания отмечает, что современную нейросеть можно использовать как для развлечения, так и для создания коммерческой рекламы, описания товаров, генерации любых текстов и даже стихов. Также программа на основе алгоритмов «Яндекса» сможет классифицировать текст по функциональному стилю.
Модель YaLV 100B обучалась на суперкомпьютерах «Яндекса», признанных мощнейшими во всей Восточной Европе. По заверению компании, в ходе машинного обучения нейросеть обработала порядка 2 терабайт текстов из открытых источников и страниц английского и русского интернета. В данный момент нейросеть предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Яндекс Интернет нейросеть