OpenAI Выпускает Gpt-oss-120b и Gpt-oss-20b, внедряя новейшие модели на локальные устройства
Коротко OpenAI выпустила две мощные модели с открытым исходным кодом, gpt-oss-120b и gpt-oss-20b, которые обеспечивают улучшенную производительность локального ИИ без доступа к Интернету, что является важным шагом в обеспечении доступности для разработчиков.
Исследовательская организация искусственного интеллекта OpenAI объявили о выпуске двух продвинутых моделей языка с открытыми весами, названных gpt-oss-120b и gpt-oss-20b. Эти модели демонстрируют высокую производительность в практических приложениях при сохранении низких эксплуатационных расходов. Выпущенные под гибкой лицензией Apache 2.0, они превосходят другие открытые модели аналогичного размера в задачах рассуждения, демонстрируют надежные возможности использования инструментов и оптимизированы для эффективной работы на потребительском оборудовании. Процесс обучения включал методы обучения с подкреплением в сочетании с информацией, полученной из OpenAIсамые передовые внутренние модели, включая o3 и другие передовые системы.
Модель gpt-oss-120b работает почти на одном уровне с OpenAIМодель o4-mini показала хорошие результаты в фундаментальных бенчмарках и эффективно работает на одном графическом процессоре 80 ГБ. В то же время, модель gpt-oss-20b демонстрирует результаты, сопоставимые с OpenAIo3-mini от компании . демонстрирует высокие результаты в распространённых бенчмарках и способен работать на периферийных устройствах с объёмом памяти всего 16 ГБ, что делает его пригодным для локальных приложений, локального вывода или быстрого тестирования без необходимости в дорогостоящей инфраструктуре. Обе модели демонстрируют отличные возможности в использовании инструментов, вызове функций с небольшим количеством попыток и цепочке рассуждений (CoT), что было продемонстрировано в агентной оценке Tau-Bench и HealthBench, порой превосходя такие проприетарные модели, как OpenAI о1 и GPT-4o.
Эти модели совместимы с API Responses и предназначены для интеграции в агентские рабочие процессы, предлагая расширенное следование инструкциям, использование инструментов, включая веб-поиск и выполнение кода Python, а также возможности логического вывода. Это включает в себя регулируемый объем логического вывода для оптимизации задач, не требующих сложных логических рассуждений или приоритетных с низкой задержкой в конечных результатах. Обе модели полностью настраиваемы, поддерживают полную цепочку рассуждений и поддерживают структурированные форматы вывода.
Соображения безопасности имеют решающее значение при выпуске этих моделей, особенно учитывая их открытость. Помимо комплексного обучения технике безопасности и оценки, был применен дополнительный уровень тестирования с использованием модифицированной версии gpt-oss-120b, разработанной с целью предотвращения атак. OpenAIРамки готовности. Модели GPT-OSS достигают показателей безопасности, сопоставимых с OpenAIНовейшие запатентованные модели, предоставляющие разработчикам аналогичные гарантии безопасности. Подробные результаты и дополнительная информация доступны в исследовательской статье и карточке модели, а методология проверена внешними экспертами, что свидетельствует о прогрессе в установлении новых стандартов безопасности для моделей с открытым весом.
OpenAI Компания сотрудничала с такими партнерами, как AI Sweden, Orange и Snowflake, для изучения возможностей практического применения этих открытых моделей, включая локальный хостинг для обеспечения безопасности данных и тонкую настройку специализированных наборов данных. Доступность этих открытых моделей направлена на предоставление широкому кругу пользователей — от индивидуальных разработчиков до крупных предприятий и государственных учреждений — возможности запускать и настраивать ИИ на собственной инфраструктуре. В сочетании с другими моделями, доступными через OpenAIБлагодаря API разработчики могут выбирать из ряда вариантов, балансирующих между производительностью, стоимостью и задержкой, для поддержки разнообразных рабочих процессов ИИ.
Gpt-oss-120b и Gpt-oss-20b теперь доступны бесплатно с расширенной поддержкой платформ и оборудования
Весовые коэффициенты для gpt-oss-120b и gpt-oss-20b доступны для скачивания на Hugging Face и поддерживают нативное квантование в формате MXFP4. Это позволяет модели gpt-oss-120b работать с объёмом памяти 80 ГБ, в то время как модели gpt-oss-20b требуется всего 16 ГБ. Обе модели прошли пост-обучение с использованием формата Harmony Prompt, а для их внедрения доступен открытый рендерер Harmony на Python и Rust. Кроме того, предоставляются референсные реализации для запуска вывода с использованием PyTorch и платформы Apple Metal, а также набор примеров инструментов для практического применения.
Эти модели разработаны для обеспечения гибкости и простоты использования, поддерживая локальное развертывание, развертывание на устройстве или через сторонних поставщиков вывода. Для повышения доступности перед запуском были установлены партнёрские отношения с основными платформами развертывания, включая Azure, Hugging Face, vLLM, O.llama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare и OpenRouter. Также было проведено сотрудничество с производителями оборудования, такими как NVIDIA, AMD, Cerebras и Groq, для обеспечения оптимальной производительности различных систем.
В связи с этим выпуском Microsoft выпускает оптимизированные для графических процессоров версии модели gpt-oss-20b для устройств Windows. Эти версии, работающие на базе ONNX Runtime, поддерживают локальный вывод и доступны через Foundry Local и AI Toolkit для VS Code, что упрощает процесс интеграции для разработчиков на платформах Windows.
Для разработчиков, которым нужны полностью настраиваемые модели, допускающие тонкую настройку и развертывание в собственных средах, модели gpt-oss представляют собой подходящее решение. Тем же, кому требуются мультимодальные возможности, встроенные инструменты и бесшовная интеграция с платформой, модели, предлагаемые через API-платформу, остаются предпочтительным выбором. Мы продолжаем отслеживать отзывы разработчиков и, возможно, рассмотрим возможность поддержки API моделей gpt-oss в будущем.
Появление моделей gpt-oss-120b и gpt-oss-20b представляет собой значительный шаг вперёд в области моделей с открытыми весами, обеспечивая значительное улучшение способности к рассуждению и повышение безопасности в данном масштабе. Эти открытые модели дополняют проприетарные модели, размещаемые на хостах, предоставляя разработчикам более широкий выбор инструментов для содействия передовым исследованиям, стимулирования инноваций и повышения безопасности и прозрачности разработки ИИ для различных приложений.
Более того, эти открытые модели помогают снизить барьеры для входа на развивающиеся рынки, в секторы с ограниченными ресурсами и для небольших организаций, которые могут столкнуться с трудностями при внедрении собственных решений. Предоставляя доступные и мощные инструменты, пользователи по всему миру получают возможность разрабатывать, внедрять инновации и создавать новые возможности. Широкое распространение этих эффективных открытых моделей, разработанных в США, способствует расширению равноправного доступа к ИИ.
Надёжная экосистема открытых моделей — важнейший компонент обеспечения широкой и инклюзивной доступности ИИ. Разработчикам и исследователям рекомендуется использовать эти модели для экспериментов, совместной работы и расширения границ достижимого. Мы с интересом ожидаем дальнейшего прогресса в этой области.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Отчет о состоянии Фонда защиты Bitget. Июль, 2025 г.
Новые спотовые маржинальные торговые пары - TOWNS/USDT
[Первичный листинг] Листинг GHO (GHO) в зоне Инноваций на Bitget
CandyBomb x TOWNS: торгуйте фьючерсами и разделите 675,000 TOWNS!
Популярное
ДалееЦены на крипто
Далее








