Telegram channel Яндекс

Яндекс

yandex

Технологии будущего и сервисы, которые делают жизнь лучше уже сегодня ya.ru

Яндекс

✏️Большие языковые модели хорошо пишут тексты, но ошибаются в сложной грамматике и пунктуации. Исследователи Яндекса и Института ИИ МГУ создали открытый датасет LORuGEC с трудными правилами русского языка и метод обучения Retrieval-Augmented Generation (с англ. «генерация, усиленная поиском»). 1️⃣ Датасет LORuGEC. Вместе со студентами-лингвистами мы собрали тысячу примеров, в которых каждой ошибке соответствует правило русского языка. Всего они охватывают 48 правил, включая сложные, например пунктуации в сложноподчинённых предложениях. 🔴 Какую проблему решает? Существующие наборы данных для проверки русского языка почти не содержат сложных правил. Например, где нужна запятая перед «и» или как правильно писать «оттого» и «от того». Поэтому модели путаются и прибегают к гиперисправлениям — вместо мелкой правки иногда переписывают всю фразу. 2️⃣ Метод обучения. Дообученная модель-поисковик GECTOR находит в датасете предложения с тем же типом ошибок и подсказывает их генеративной модели. Например, если пропущена запятая перед «что», модель получает пример именно с такой ошибкой, а не случайную пунктуационную ошибку. 🔴 Какую проблему решает? Учит модели точно исправлять ошибки без сложного переобучения на новых данных из датасета. С методом точность исправлений сложных ошибок выросла на 5–10% по международному стандарту оценки грамматической коррекции. ↘️ Статья о датасете и методе дообучения получила приз на конференции ACL 2025. LORuGEC и GECTOR выложены в открытый доступ для исследователей и разработчиков. Применяйте его для создания образовательных сервисов. Подписывайтесь ❌ @yandex

Open message in Telegram

11/26/2025

Яндекс

🔴 Хорошие рекомендации — это непросто. Нужно среди миллионов и миллиардов товаров, треков, видео найти те, которые будут интересны пользователю. А пользователей этих могут быть миллионы. Рассказываем про новую систему рекомендаций на генеративных моделях в Яндексе. ↗️ ARGUS — новая система рекомендаций Яндекса. Она анализирует действия и поведения пользователей, и предсказывает их интересы, учитывая контекст, сезонность и неочевидные человеку связи. Подписывайтесь 🔴 @yandex

Open message in Telegram

7/8/2025

Яндекс

💜 Пользуйтесь самыми мощными нейросетями Яндекса бесплатно и без ограничений по количеству запросов. Рассказываем про большое обновление чата с Алисой и новые функции для подписчиков опции Алиса Про. ↗️ Используйте новые бесплатные возможности в чате на alice.yandex.ru и на ya.ru. А также в приложениях Алиса, Яндекс с Алисой и Яндекс Браузер для Android. Подписывайтесь 〰️ @yandex

Open message in Telegram

7/1/2025

Яндекс

🔍 Увеличили вознаграждения за найденные ошибки в наших сервисах: Яндекс Почте, Яндекс ID и Yandex Cloud. Повышенные выплаты касаются ошибок, связанных с удалённым выполнением кода и атаками на виртуализацию. Мы платим за найденные уязвимости в инфраструктуре и сервисах Яндекса, в мобильных приложениях и умных устройствах, в Яндекс Браузере и Алисе. Недавно запустили новое направление — поиск уязвимостей, связанных с генеративными нейросетями. ↗️ В прошлом году охотникам за ошибками в сервисах Яндекса выплатили 50,8 млн рублей. Подписывайтесь 🔴 @yandex

Open message in Telegram

5/26/2025

Яндекс

🛴 Вот так мы тестируем наши самокаты: бросаем их с высоты, сталкиваем с бордюром, складываем и раскладываем подножку 60 тысяч раз. Мы убеждаемся, что они стойкие, надёжные и не сломаются. Каждое из этих испытаний показали в этом видео. ↗️ О других этапах жизни самоката, о том, что с ними происходит до и после испытаний мы рассказывали в экскурсии по заводу, где их собирают, и в шоу Q&A с ответами на ваши вопросы. Ставьте буст, чтобы у нашего канала появилось больше сторис ❤️

Open message in Telegram

4/26/2025