В Decrypt протестировали Grok 4 и обнаружили политическую предвзятость чат-бота

Bitget App

Торгуйте разумнее

Bitget

Новости

Incrypted2025/07/13 22:21

Автор:Olena Kocherhina

Тестирование чат-бота Grok 4 изданием Decrypt разоблачило его политическую предвзятость.
Журналисты отметили, что Grok 4 поразил логикой, но провалился в креативности и кодировании.
В то же время они посоветовали найти альтернативу базовому тарифу ИИ-решения стоимостью $30 в месяц.

Журналисты Decrypt протестировали Grok 4 Basic — упрощенную версию флагманского Grok 4 Heavy (по стоимости в $300/мес), чтобы выяснить оправдана ли цена в $30 в месяц.

Новая базовая модель искусственного интеллекта (ИИ) Grok 4 Basic от Илона Маска, которую xAI представила на днях, вызвала неоднозначные впечатления. В издании отметили высокий уровень логического мышления и голосовые возможности, однако имеющуюся слабую креативность и политическую предвзятость.

Политическое искажение: ИИ Маска думает как Маск

Согласно материалу, одной из самых тревожных находок стал так называемый «Elon-фильтр». Когда журналисты задавали вопросы о войне в Газе, абортах или других чувствительных темах, Grok 4 Basic систематически ссылался на сообщения самого Маска в X (бывший Twitter) или новости, поддерживающие его взгляды, и занимал ту же позицию.

«Этот “максимально стремящийся к правде” ИИ, которого Маск обещал при запуске, ищет правду преимущественно через призму соцсетей своего создателя», — отметили авторы рецензии.

При этом нет очевидной инструкции в системном промпти, которая бы направляла модель на такие источники — поэтому непонятно, это баг или задуманный алгоритм.

Напомним, что недавно чат-бот Grok резко высказался о демократах, Голливуде и «еврейских руководителях» киностудий.

Мышление — на высоте

В логических и юридических задачах Grok 4 превзошел ожидания. На вопрос «Может ли мужчина жениться на сестре своей вдовы?» модель мгновенно распознала логическую ошибку и ответила с юридическим обоснованием:

«Вопрос предполагает фактическую невозможность, что делает брак недействительным ab initio [то есть с момента заключения]».

В сфере научного рассуждения, Grok 4 работает с уровнем доктора философии, выдавая точные и основательные объяснения.

Креативность и кодирование — слабые места

По данным анализа, в творческих заданиях Grok 4 провалился. Его истории выглядели шаблонно, со скучными диалогами и невнятным построением. Несмотря на хорошую структурную логику, нарративная энергия отсутствовала.

Для художественных задач в Decrypt посоветовали:

«Пусть Grok 4 построит сюжетную схему, а Claude 4 Opus — напишет текст».

С программированием — тоже проблемы. Несмотря на заявленные улучшения, Grok 4 не смог создать полноценную игру даже после нескольких итераций, а исправление одной ошибки часто приводило к появлению других.

Даже предыдущая версия — Grok 3 — справилась с этой задачей лучше.

Отметим, что в начале июля 2025 года компания xAI получила денежные поступления в размере $10 млрд для дальнейшего развития чат-бота и расширения дата-центра Colossus.

Голосовые функции — преимущество модели

Лучшая часть Grok 4 — голосовое взаимодействие. Модель может озвучивать сказки на ночь длиной несколько минут, используя выразительную интонацию, темп и плавность. Также есть предварительно настроенные «личности» — от терапевта до «режима для взрослых” («sexy mode»), что добавляет вариативности без сложных промптов.

Но отсутствие функций общего экрана ограничивает модель в визуальных задачах — здесь лучшим выбором будет Gemini Live.

Поиск в больших контекстах — неудача

Grok 4 не справился с одним из базовых тестов: отказался обработать запрос объемом 83 000 токенов, хотя xAI обещает контекст в 126 000. Это вызвало вопросы к заявленным возможностям модели.

Вывод: интеллект — есть, но не универсальный

Grok 4 Basic — это мощная модель для аналитики, но слабая для творчества и программирования. Ее голосовые возможности выделяются на рынке, а вот политическая предвзятость — серьезный минус, особенно для тех, кто ищет непредвзятый ответ.

«Если вас не пугает влияние Маска на ответы, вы получите ИИ с высоким уровнем аналитики и качественным голосовым взаимодействием. Но за $30 в месяц, если вам нужно больше — лучше поискать альтернативу», — подытожили в Decrypt.

Напомним, что в июне этого года Маск сообщил об использовании Grok 3.5 с целью обработки знаний человечества.

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.

APR до 12%. Аирдропы новых токенов.

Внести!