OpenAI презентовали следующую модель нейросети — GPT-5. Над моделью разработчики трудились как минимум с середины 2023 года, а, возможно, и раньше. Пришлось преодолеть нехватку качественных данных, рост затрат и других сложностей. Но оно того стоило: GPT-5 превосходит GPT-4о по количеству ответов без ошибок на 80% — и это победа. А еще она доступна бесплатно. Правда, если замолчать, то будет слышно, как где-то плачет одинокий айтишник.

Во время тестирования экспертами GPT-5 Pro показала лучшие результаты по GPQA (88.4 %) и высокую точность в задачах уровня PhD (89.4 %). Если перевести с айтишного на человеческий, то новая модель:
OpenAI считают это своей гордостью и утверждают, что GPT-5 способна скрутить адаптивный сайт с красивым и понятным интерфейсом по одному лишь промпту. При тестировании нейросеть попросили сделать одностраничник для рисования с палитрой красок, несколькими вариантами кистей и холстом, разлинеенным квадратной сеткой. Это был единый запрос, по результатам которого получился сайт по типу Paint.

Источник: OpenAI
Тогда эксперты пошли дальше и сделали запрос на обучающую языковую платформу, которая будет в игровой форме обучать французскому языку. Тоже всего один запрос, а через 2 минуты — сайт с мини-играми, тестами и даже голосом за кадром.
Учитывая, что модель стала более бережно относиться к фактам и меньше придумывает, то и в повседневной жизни она тоже стала полезнее. Главная проблема, которую пытались исключить OpenAI при разработке новой модели — галлюцинации. Это когда нейросеть на голубом глазу несет откровенный бред или не будучи достаточно осведомленной подменяет факты так искусно, что вы даже не задумаетесь перепроверить.
Этот момент был исключен на 80% и теперь даже запросы с конкретными расчетами будут жизнеспособными. Например, GPT-5 может предположить рентабельность бизнеса, предварительно исследовав нишу, и дать рекомендации. А еще ей можно сказать, чтобы она придумала что-нибудь на ужин из креветок, составила на основе этого список продуктов и рассчитала его приблизительную стоимость — и это будет реальная средняя стоимость, а не просто цифры из космоса.