OpenAI анонсували нові інструменти для створення автономних ШІ

Щось сьогодні у світі ШІ багато новин для розробників. Цього разу OpenAI випустили оновлення API, які мають спростити і прискорити створення власних агентських систем.

Посилання на офіційний стрім:

Що саме анонсували?

Сьогодні OpenAI представили новий набір інструментів і API, що спрощують створення агентів – систем, здатних самостійно виконувати завдання від імені користувачів. Ці новинки допоможуть розробникам і компаніям швидше створювати надійні агентні застосунки, зменшивши необхідність складної кастомної логіки та численних ітерацій промптів.

  1. Responses API

Нове API, яке:

  • Поєднує простоту Chat Completions і можливості використання інструментів Assistants API.
  • Підтримує вбудовані інструменти: веб-пошук, пошук по файлах і виконання завдань на комп’ютері.
  • Забезпечує просту інтеграцію та доступ до результатів моделі через SDK-хелпери.
  1. Вбудовані інструменти Responses API

А саме:

Веб-пошук:

  • Дозволяє отримувати актуальну інформацію з інтернету із зазначенням джерел.
  • Використовує моделі GPT-4o і GPT-4o-mini.
  • Має високу точність (90% за тестами SimpleQA).

Пошук за файлами:

  • Швидко витягує інформацію з великих обсягів документів.
  • Підтримує різні типи файлів, метадані та кастомні налаштування ранжування.
  • Зручний для агентів підтримки клієнтів, юридичних і технічних помічників.

Використання комп’ютера (Computer Use Tool):

  • Дозволяє агентам виконувати завдання на комп’ютері, імітуючи дії миші та клавіатури.
  • Працює через модель CUA (Computer-Using Agent), що вже показала рекордні результати у веб-завданнях.
  • Підходить для автоматизації QA, заповнення даних і роботи із застарілими системами.

Приклад роботи з файлами:

const productDocs = await openai.vectorStores.create({ name: "Product Documentation", file_ids: [file1.id, file2.id, file3.id], }); const response = await openai.responses.create({ model: "gpt-4o-mini", tools: [{ type: "file_search", vector_store_ids: [productDocs.id], }], input: "What is deep research by OpenAI?", }); console.log(response.output_text);

Приклад роботи з Computer Use:

const response = await openai.responses.create({
model: "computer-use-preview",
tools: [{
type: "computer_use_preview",
display_width: 1024,
display_height: 768,
environment: "browser",
}],
truncation: "auto",
input: "I'm looking for a new camera. Help me find the best one.",
});

console.log(response.output);

Ну і трошки бенчмарків цих тулів:

3. Agents SDK

Відкритий інструмент для простої оркестрації багатоагентних сценаріїв (мабуть, конкурент LangChain). Включає зручну конфігурацію агентів, механізм передавання завдань між агентами, перевірки безпеки (Guardrails) та інструменти моніторингу для оптимізації роботи агентів.

Agents SDK дає змогу зручно конфігурувати агентів з інструкціями, вбудованими інструментами, передачею завдань і перевірками безпеки. SDK вже підтримує Python, скоро буде доступна підтримка Node.js.

За допомогою Agents SDK компанії можуть швидко інтегрувати агенти в робочі процеси, наприклад, для опрацювання клієнтських звернень, аналізу даних і автоматизації продажів.

Приклад коду:

from agents import Agent, Runner, WebSearchTool, function_tool, guardrail

@function_tool
def submit_refund_request(item_id: str, reason: str):
# Your refund logic goes here
return "success"

support_agent = Agent(
name="Support & Returns",
instructions="You are a support agent who can submit refunds [...]",
tools=[submit_refund_request],
)

shopping_agent = Agent(
name="Shopping Assistant",
instructions="You are a shopping assistant who can search the web [...]",
tools=[WebSearchTool()],
)

triage_agent = Agent(
name="Triage Agent",
instructions="Route the user to the correct agent.",
handoffs=[shopping_agent, support_agent],
)

output = Runner.run_sync(
starting_agent=triage_agent,
input="What shoes might work best with my outfit so far?",
)

Плани на майбутнє

OpenAI прагне зробити агентів невід’ємною частиною робочих процесів у всіх галузях, значно підвищуючи продуктивність праці. Компанія продовжить розвивати і поглиблювати інтеграції та інструменти для швидкого і зручного створення агентів, анонсуючи нові можливості вже найближчим часом.

Популярні Пости