Поддержать команду Зеркала
Беларусы на войне
  1. Осужденный за убийство беларуски в Варшаве подал жалобу на приговор. Стало известно окончательное решение по делу
  2. Россия задействовала «ошеломляющее количество» живой силы и техники для захвата Покровска. Что сейчас происходит в городе и вокруг него
  3. Для тех, у кого есть автомобили, квартиры и земельные участки, чиновники придумали очередное налоговое новшество
  4. Стало известно, какие продукты беларусы едят больше всех в мире. И это не картофель
  5. Собрали пять скрытых признаков СДВГ у взрослых. Эти особенности часто принимают за характер, но их игнорирование опаснее, чем кажется
  6. Польский визовый центр добавил новую категорию виз. Кто по ней может подать документы
  7. Для тех, кто получает подарки не от родственников, хотят ввести налоговое новшество. Тот случай, когда оно вряд ли понравится
  8. Крупнейшую сеть фастфуда в Беларуси открывал выходец из КГБ. Рассказываем
  9. Его открывали с помпой и снесли тайком за одну ночь. Рассказываем, что за огромный памятник стоял в центре Минска
  10. «У всех сейчас одна в любой валюте». Стала известна рыночная цена подсадки в автобусы на границе Беларуси с Польшей
  11. Беларусь готовится получить щедрый «подарок» из-за границы — его масштабы впечатляют. Но это несет риски для страны
  12. Для водителей намерены ввести новшество с 1 января
  13. Жителям четырех районов Минска в воду добавят флуоресцеин. Что это
  14. Синоптики рассказали, когда в страну придет «весьма существенное похолодание»


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.