OpenAI представила функцію, яка дозволяє чат-боту ChatGPT проводити дослідження
Функція працює на моделі o3, яка здатна міркувати, і вже доступна користувачам ChatGPT Pro у США з лімітом у 100 досліджень на місяць. У майбутньому OpenAI планує розширити її доступність для ChatGPT Plus і Teams в інших країнах, а також збільшити кількість дозволених запитів на місяць.
today we launch deep research, our next agent.
— Sam Altman (@sama) February 3, 2025
this is like a superpower; experts on demand!
it can go use the internet, do complex research and reasoning, and give you back a report.
it is really good, and can do tasks that would take hours/days and cost hundreds of dollars.
OpenAI повідомляє, що нова функція призначена для “людей, які інтенсивно працюють зі знаннями в таких галузях, як фінанси, наука, політика та інженерія, і потребують ретельних, точних і надійних досліджень”. Deep Research також може бути корисною для тих, хто робить “покупки, які зазвичай вимагають ретельного дослідження, наприклад, автомобілі, побутову техніку чи меблі”.
Наразі результати глибокого дослідження ChatGPT є лише текстовими. Але OpenAI заявляє, що незабаром планує додати вбудовані зображення, візуалізацію даних та інші “аналітичні” результати. Також на дорожній карті є можливість підключення “більш спеціалізованих джерел даних”, в тому числі “на основі підписки” та внутрішніх ресурсів.
У фінальній відповіді ChatGPT надає повний список використаних джерел. Це особливо важливо, оскільки штучний інтелект все ще може помилятися в інтерпретації даних або вигадувати факти. Можливо, саме з цієї причини OpenAI заявила, що кожен результат глибокого дослідження ChatGPT буде “повністю задокументований, міститиме чіткі цитати та короткий виклад основних думок, що дозволить легко перевіряти інформацію”.
OpenAI повідомила, що протестувала нову функцію за допомогою Humanity’s Last Exam — тесту з понад 3000 експертних питань у різних академічних сферах. Модель o3, яка лежить в основі глибоких досліджень, досягла точності 26,6%. Хоча цей показник може здатися низьким, він значно перевершує результати інших моделей: Gemini Thinking набрала лише 6,2%, Grok-2 — 3,8%, а GPT-4o — 3,3%.