В Новосибирской области резко сокращается поголовье КРС, лошадей и овец

Рисовая шелуха и опилки: новосибирские ученые разработали новый состав ДСП

В Новосибирске на улице Сухарной началось строительство нового моста

Новосибирский космонавт Кикина пережила в космосе пожар и разгерметизацию

25 июня 2024 18:05
Новость

Выпускница из Новосибирска разработала датасет для обучения ИИ пересказывать научные статьи

Лента новостей

12:35 После атаки БПЛА в Ростовской области людей эвакуируют из жилого дома

12:27 В Новосибирске прокуратура добилась выплаты долгов по зарплате на 6 млн рублей

12:13 В аэропорту Нижнекамска введены ограничения

12:05 При атаке дронов ВСУ на Подмосковье пострадали два человека

11:45 Пострадавшие в ДТП в Новосибирске полгода не могут добиться возбуждения уголовного дела

11:35 Над Россией сбито 48 украинских БПЛА

11:24 В Новосибирске резко сократилось число травм среди самокатчиков

11:23 Аэропорт Казани закрыт в целях безопасности

11:22 Дмитрий Пьянов: 46% россиян готовы переводить средства в цифровые платежи

11:11 Аэропорты Саратова, Самары и Ярославля работают с ограничениями

11:00 МегаФон подключит свои салоны к биометрии в регионах Сибири

11:00 БПЛА атаковали Сергиево-Посадский округ в Подмосковье сегодня утром

10:55 Трамвай №18 в Новосибирске временно поменяет маршрут из-за ремонта путей

10:20 Лишенный прав житель Новосибирской области приехал к зданию суда на своем Mercedes

10:00 Женщина погибла из-за атаки БПЛА ВСУ на Миллеровский район Ростовской области

10:00 ФШ «Динамо» и департамент образования мэрии запускают новый сезон нашумевшего проекта «Школьные футбольные таланты» в Новосибирске

09:18 Дожди, грозы и град накроют Новосибирскую область на выходных

09:00 Китай рассчитывает на помощь ФРГ в тайваньском вопросе

08:52 Новосибирским компаниям предложили создать совместную онлайн-платформу с Узбекистаном

08:30 НАТО начинает готовиться к сокращению американских войск на континенте

08:27 За нападение на росгвардейца в Новосибирске мужчине грозит 10 лет колонии

07:54 В Новосибирске спасатели пришли на помощь девочке, которую уносило течением

07:23 В Новосибирске изъяли 100 кг фруктов и овощей у нелегальных торговцев

07:05 Резидентов первой новосибирской ОЭЗ освободят от налога на прибыль

07:00 В Воронежской области объявлена опасность атаки БПЛА

06:05 С 4 июля новосибирские дачники не смогут ставить заборы на даче

06:00 Трамп заявил об отсутствии прогресса в украинском урегулировании

05:36 Стала известна возможная причина смерти пассажира при перелете в Москву

05:05 Такой жары в Новосибирске не было 100 лет: климатолог заявил о глобальном потеплении

05:00 Кобахидзе: Грузия не допустит пятой попытки революции со стороны Запада

04:32 Новосибирцам на заметку: фильтрованная вода опасна для детей

04:03 Зарплаты новосибирцев подрастут во второй половине июля-2025

04:01 Встреча министров восьми стран ОПЕК+ перенесена на субботу, 5 июля

03:30 «Прогресс МС-31» стартовал к МКС

03:00 ТАСС: ВСУ атаковали ДНР ракетами Storm Shadow

02:45 Аэропорт Волгограда вернулся к штатной работе

02:30 Умер актер Кеннет Колли, сыгравший адмирала Пиетта в «Звездных войнах»

02:15 Аэропорт Волгограда приостановил прием и отправку рейсов

02:00 Россия официально признала Исламский Эмират Афганистан

01:54 Франция продлевает допустимый срок эксплуатации АЭС

01:45 Гладков сообщил о еще одном пострадавшем при атаках ВСУ на Белгородскую область

01:16 Банк России может ограничить срок действия карт Visa и Mastercard

01:15 Умер звезда фильмов Тарантино Майкл Мэдсен

00:45 Беспилотники ВСУ атаковали многоэтажку и соцобъект под Белгородом

00:38 Аксаков: надо приучать зарубежные страны к использованию цифрового рубля

00:30 Путин и Трамп обсудили совместные проекты по космосу и энергетике

00:15 Прокуратура расследует массовое отравление в Пскове

00:00 Советник председателя ЦБ РФ сообщил о вариантах снижения ключевой ставки

03 июля, 23:53 Проект очистных для новосибирского ЛДС «Сибирь-Арена» скорректируют за ₽22,4 млн

03 июля, 23:35 Ушаков: Путин и Трамп обсудили Украину и Ближний Восток

03 июля, 23:22 Новак: до 82% выросла за три года торговля России с дружественными странами

03 июля, 23:15 ТАСС: взрыв в Луганске, при котором погиб Пилавов, могла совершить смертница

03 июля, 23:00 Аэропорты Ижевска и Нижнекамска вернулись к штатной работе

03 июля, 22:44 На Украине может закрыться крупнейший металлургический комбинат

03 июля, 22:30 Песков: Путин проводит телефонный разговор с Трампом

03 июля, 22:15 Пятеро сотрудников «Sputnik Азербайджан» отпущены под подписку о невыезде

03 июля, 22:06 Европарламент призовет к экспроприации российских активов

03 июля, 21:55 Над тремя регионами России сбиты четыре украинских БПЛА

03 июля, 21:45 СК квалифицировал как теракт взрыв в Луганске

03 июля, 21:28 Минтранс предложил создать нацфонд ликвидации разливов нефти

03 июля, 21:15 Глава Еврокомиссии назвала заморозку США поставок оружия Украине сигналом для ЕС

03 июля, 20:50 Через Солнечную систему пройдет третий в истории межзвездный объект

03 июля, 20:35 Армения желает стать полноправным членом ШОС

03 июля, 20:23 Набиуллина исключила банковский кризис в России

03 июля, 20:20 Путин анонсировал телефонный разговор с Трампом

03 июля, 20:00 Суд Кишинева 5 августа огласит приговор Гуцул

03 июля, 19:51 ТАСС: экс-мэр Луганска Пилавов погиб при взрыве в центре города

03 июля, 19:45 В аэропорту Нижнекамска введен план «Ковер»

03 июля, 19:30 Бречалов: ВСУ с помощью БПЛА атаковали объект в Удмуртии

03 июля, 19:15 При атаке украинских дронов в Брянской области погиб мужчина

03 июля, 19:03 Во «ВКонтакте» произошел массовый сбой

03 июля, 18:52 FT: Трамп и Зеленский обсудят приостановку поставок оружия Украине

03 июля, 18:31 В Курской области увековечат память погибшего замглавкома ВМФ Гудкова

03 июля, 18:17 Концерт певца Эмина в Светлогорске перенесли на год

03 июля, 18:09 Захарова: согласован консульский доступ к задержанным в Баку россиянам

03 июля, 17:51 Путин назначил Андрея Прицепова послом в Сент-Винсенте и Гренадинах

03 июля, 17:44 В МВД по Ингушетии опровергли сообщения об обысках в ведомстве

03 июля, 17:43 «Яндекс Маркет» подвел итоги ежегодной конференции «E-Com Сфера»

03 июля, 17:36 Парламент в Армении ратифицировал соглашение с Россией о деятельности РАУ

03 июля, 17:22 Минпромторг сообщил о падении продаж новых автомобилей на 28% за полгода

03 июля, 17:15 В Петербурге ожидается первое за 160 лет июльское наводнение

03 июля, 16:54 Песков: в согласовании нового раунда переговоров с Украиной «нет затыков»

03 июля, 16:43 Погиб заместитель главкома ВМФ, Герой России Михаил Гудков

03 июля, 16:35 Один человек погиб и трое ранены при взрыве в Луганске

03 июля, 16:34 Армия России взяла под контроль Меловое в Харьковской области и Разино в ДНР

03 июля, 16:16 Tageszeitung: Украина может забыть о сближении с США

03 июля, 16:15 Футболист сборной Португалии и «Ливерпуля» Диогу Жота погиб в ДТП

03 июля, 15:54 В России утром 3 июля сбили три беспилотника ВСУ

03 июля, 15:52 «Ингосстрах» протестировал платежи с помощью цифрового рубля

03 июля, 15:38 В России введут налоговые льготы для IT-компаний с госучастием

03 июля, 15:27 Аэропорт Самары возобновил работу в обычном режиме

03 июля, 15:26 МТС запустила экспресс-доставку сим-карт для бизнеса

03 июля, 15:20 В Ростовской области будут отключать мобильный интернет

03 июля, 14:57 Климатолог назвал причину холодного начала лета в России

03 июля, 14:36 Задержанной в Петербурге девушке обещали деньги за подготовку теракта

03 июля, 14:19 В брянской Ломаковке при атаке дронов ВСУ пострадал мирный житель

03 июля, 14:14 Генпрокуратура потребовала национализировать ЮГК

03 июля, 14:05 Аэропорт Казани работает с ограничениями

03 июля, 13:59 В Санкт-Петербурге задержана 23-летняя россиянка, готовившая теракт

03 июля, 13:53 Москва отметит День города 13 и 14 сентября

03 июля, 13:41 WP: ситуация на Украине достигла переломного момента

03 июля, 13:18 Украине предрекли мрачную расплату из-за прекращения поставок оружия США

03 июля, 13:13 Ранивший врачей в Иркутске объяснил мотив нападения

03 июля, 12:45 Ограничения введены в аэропорту Ульяновска

03 июля, 12:17 ТАСС: в Москве арестована замглавы Росгидромета Наталия Радькова

03 июля, 11:59 При пожаре на предприятии в Тамбовской области погибли трое сотрудников

03 июля, 11:54 Аэропорт Самары ограничил прием и отправку самолетов

03 июля, 11:47 В Ельце после прилета БПЛА загорелась парковка одного из предприятий

03 июля, 11:33 Минобороны сообщило об уничтожении за ночь 69 БПЛА

03 июля, 10:53 BBC: пассажирский паром затонул у индонезийского острова Бали

03 июля, 10:38 Один дрон попал в строящуюся секцию многоквартирного дома в Ельце

03 июля, 10:23 В Иркутске пациент с ножом напал на медиков

03 июля, 10:00 Женщина погибла в Липецкой области после падения обломков БПЛА

03 июля, 09:00 ТАСС: трое исполнителей теракта в «Крокусе» были под воздействием наркотиков

03 июля, 08:03 В Воронежской области уничтожены пять БПЛА

03 июля, 07:00 Временные ограничения введены в аэропорту Тамбова

03 июля, 06:00 Корабль «Прогресс МС-31» отправится к МКС 3 июля

03 июля, 05:01 Пентагон: иранская ядерная программа сократилась на срок до двух лет

03 июля, 04:01 Semafor: Трамп проведет саммит с лидерами стран Африки

03 июля, 03:35 Путин пошутил о скором наступлении зимы из-за промозглого лета

03 июля, 03:15 В Киеве прогремели взрывы

03 июля, 03:00 Трамп исключил «Рособоронэкспорт» из списка сирийских санкций

Все новости »

Уникальность этого датасета заключается в его мультимодальности

Фото: Пресс-служба НГУ

В Новосибирске состоялась значительная разработка в сфере искусственного интеллекта: выпускница НГУ Алена Цанда создала первый открытый мультимодальный датасет для машинного обучения, предназначенный для реферирования научных статей. Об этом сообщили в пресс-службе университета.

Уникальность этого датасета заключается в его мультимодальности: он содержит не только тексты научных статей и их аннотации, но и таблицы, рисунки и описания к ним. Это первый подобный датасет для работы с русскоязычными научными текстами, размещенный в открытом доступе. Ранее подобные датасеты для научной области были недоступны.

"Наша цель – генерировать краткое содержание статей, что особенно важно для научных текстов в связи с растущим объемом информации в сети", – поясняет Алена Цанда.

Датасет включает в себя 480 статей, каждая из которых представлена в виде отдельной директории. Текстовая информация, включающая название работы, аннотацию и полный текст статьи, хранится в текстовых файлах.

Графические элементы, такие как рисунки и таблицы, были вручную сохранены в виде скриншотов. Описания к ним представлены в формате JSON, удобном для чтения как людьми, так и машинами.

В датасете описано 496 рисунков и 279 таблиц. На этом датасете исследователи протестировали популярные большие языковые модели: Gigachat (SBER), YandexGPT (Яндекс) и GPT-3.5 Turbo (OpenAI).

"Интересно, что во время тестирования проявилась особенность современных языковых моделей – цензура. Gigachat, например, посчитал 59% статей датасета неэтичными", – отмечает Цанда.

В дальнейшем разработчики планируют расширить датасет, включив в него статьи по математике и физике, что станет более сложной задачей, так как в них присутствует большое количество формул.

Алена Цанда работала над мультимодальным датасетом совместно со своим научным руководителем Еленой Бручес, кандидатом технических наук, старшим преподавателем кафедры фундаментальной и прикладной лингвистики.

Вместе они подготовили статью для участия в международной конференции по искусственному интеллекту AINL 2024. Разработчики планируют использовать собранные данные для изучения других подходов к суммаризации текстов, а также создать собственный инструмент для генерации аннотаций к научным статьям.