Российские ученые ускорили работу искусственного интеллекта с длинным текстом

17 августа 2024 - Журналист

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

Суть открытия

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

Исходный код и дополнительные материалы можно найти на GitHub.

Лаборатория T-Bank AI Research

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

Подпишитесь на наш Telegram-канал и на наш паблик в соцсети Вконтакте, следите за актуальными новостями Перми и Пермского края..

Посмотреть все новости раздела "Технологии"

Рейтинг: 0 Голосов: 0 2136 просмотров

Комментарии (0)

Нет комментариев. Ваш будет первым!

Добавить комментарий

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

Последние новости

Шесть школьников из Прикамья стали призе...
22:44

Новости Перми и Пермского края

-0 -305
В Перми завершился Кубок России по прогр...
16:13

Технологии

-0 -348
Пермские школьники познакомились с угроз...
15:49

Новости Перми и Пермского края

-0 -443
Пермские скалолазы покоряют вершину само...
20:16

Новости Перми и Пермского края

-0 -586
В Перми пройдут «Большие гастроли» ведущ...
19:40

Культура и шоу-бизнес

-0 -564
Спортивное шоу «Суперниндзя. Дети» возвр...
19:15

Кино и ТВ

-0 -462
Пермяки Владимир Селиванов и Светлана Пе...
16:27

Кино и ТВ

-0 -513
Открыт набор в Коми-Пермяцкую актёрскую...
17:08

Новости Перми и Пермского края

-0 -1596
Пермский Политех возглавил рейтинг по по...
12:46

Новости Перми и Пермского края

-0 -1387
Путевки в загородные лагеря Пермского кр...
11:55

Новости Перми и Пермского края

-0 -1385
Дягилевский фестиваль откроет продажу би...
19:24

Культура и шоу-бизнес

-0 -1456
Со стратегиями обмана телефонных мошенни...
19:22

Новости Перми и Пермского края

-0 -1519

Все новости

Популярные новости за неделю

Открыт набор в Коми-Пермяцкую актёрскую студию

24 апреля 2025 - Журналист - 0 - 1596

Министерство культуры Пермского края, Коми-Пермяцкий национальный драматический театр и Пермский государственный институт культуры объявляют о проведении целевого набора абитуриентов для обучения по направлению «Актёрское искусство», специализация «Артист драматического театра и кино».

Со стратегиями обмана телефонных мошенников познакомились пермские студенты

23 апреля 2025 - Журналист - 0 - 1519

Новая лекция по цифровой грамотности от партийного проекта «Цифровая Россия» прошла на площадке Пермского профессионально- педагогического колледжа.

Дягилевский фестиваль откроет продажу билетов 29 апреля

23 апреля 2025 - Журналист - 0 - 1456

Дягилевский фестиваль в 2025 году пройдет в Перми с 13 по 22 июня и представит несколько оперных премьер, симфонические и камерные концерты, междисциплинарные перформансы и драматические спектакли. Особенностью фестиваля в этом году станет проект «Горизонты Д», который объединит молодых художников, режиссеров, драматургов, композиторов, балетмейстеров, которые попробуют переосмыслить идеи Дягилева через эксперимент и новые формы театра.

Премьера «Родители напрокат» на детской сцене ТТ

23 апреля 2025 - Журналист - 0 - 1406

Родителей, как известно, не выбирают. А если такая возможность представится? Десятилетней Ане, героине спектакля «Родители напрокат», после одной из семейных ссор предлагают поменять родителей, чтобы найти таких, которые не будут вечно командовать, ворчать и все запрещать. В общем, найти идеальных. Но могут ли идеальные родители заменить родных?

Пермский Политех возглавил рейтинг по популяризации научных исследований среди 615 вузов России

24 апреля 2025 - Журналист - 0 - 1387

Исследовательская команда медиагруппы «Россия сегодня» и система анализа социальных медиа Brand Analytics подвели итоги рейтинга представленности вузов в научно-популярных СМИ за I квартал этого года. Пермский Политех занял первое место, опередив МГУ, ВШЭ и МФТИ. Всего в списке значатся 615 университетов России.

RSS-лента статей

Новые статьи

Где в Перми купить дубайский шоколад: адреса, цены и секреты выбора

сегодня в 00:30 - Журналист - 0 - 222

Дубайский шоколад с фисташковой начинкой и хрустящим тестом катаифи стал настоящим трендом 2025 года.

Как самому поехать в Китай

вчера в 23:37 - Журналист - 0 - 196

Отправиться в Китай самостоятельно — задача, которая пугает многих туристов, но при грамотной подготовке превращается в увлекательное приключение.

Меньше месяца остается до открытия одного из самых авторитетных нефтегазохимических выставок страны

вчера в 13:23 - Журналист - 0 - 234

С 20 по 23 мая 2025 года в Уфе состоятся ключевые отраслевые события - Российский нефтегазохимический форум и 33-я международная выставка «Газ. Нефть. Технологии».

В Рособрнадзоре предупредили о мошенничестве с фейковыми ответами на ЕГЭ и ОГЭ

23 апреля 2025 - Журналист - 0 - 882

Интернет-мошенники обещают направить реальные ответы на ЕГЭ и ОГЭ, но схема заканчивается уже на этапе направления аванса в их адрес.

RSS-лента статей

Страницы: 1 2 3 Следующая Последняя

Российские ученые ускорили работу искусственного интеллекта с длинным текстом

Основные разделы

Информация