Поддержать команду Зеркала
Беларусы на войне
  1. В Минске с крыши самого высокого жилого дома спрыгнул человек
  2. Счет женщин шел на десятки. Подробности интимной жизни самого любвеобильного правителя на территории Беларуси
  3. Французский тренч и сумка за тысячи долларов. Сколько стоит образ, в котором Наталья Петкевич посетила монастырь
  4. Мобильные операторы предупредили клиентов, что вводят изменения
  5. «Генеральное наступление осени по всем фронтам». Какой будет погода до конца сентября
  6. Беларусь заняла «почетное» место, а победил Вьетнам. В России прошел конкурс-заменитель «Евровидения»
  7. Окончательно «умерла» одна из фирм на автомобильном рынке. Появились новые подробности этой истории
  8. Власти уверяют, что не будут поднимать пенсионный возраст. Экономист же считает, что другого выхода нет — и напрячься надо женщинам
  9. Встреча Путина и Трампа на Аляске привела к одному неприятному последствию. Вот к какому
  10. Погиб в ДТП, умер в изгнании, жив, но давно не дает интервью. Как сложились судьбы беларусских олигархов
  11. Путин сделал важный вывод после встречи с Трампом и, похоже, специально слил его в СМИ. О чем идет речь и зачем он это сделал


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.