Всем привет! Последние пару лет на каждом шагу трубят про нейросети. И я старательно избегал этой темы до позавчерашнего дня.
Предисловие:
Дело в том, что в плане готовки я бытовой инвалид. До недавнего времени, пиком моего кулинарного искусства была яичница с сосисками. Но вот уже почти два года как я стал отцом и ребенок перешел уже в тот возраст, когда он хочет кушонить 3-4-5 раз в день, а поскольку жене тоже надо отдыхать, а я работаю из дома, как минимум половину приемов пищи ложится на меня и готовить каждый раз одно и тоже не прокатит :)
Поэтому я полез в яндекс в поисках простых рецептов как приготовить то или иное блюдо и в 99% случаев получал стену текста в 2-3 страницы А4 (потому что иначе SEO не сработает и надо все засрать вот этим мусором для поисковиков), а не короткий ответ как готовить макароны. И я полез в нейросеть (Грока), который, блин, выдал мне коротенький ответ. Все!
Поэтому я решил сделать небольшой тест нейросетей, какая из них лучше подходит для "бытовых" вопросов, а не для решения уравнений в квантовой физике или генерации картинок.
Больше трех нейросеток мне было лень тестировать, поэтому я взял те, которые "на слуху", плюс определенные критерии:
Доступна в России без костылей.
Доступна в мессенджере, МАКСИМУМ на сайте, отдельное приложение - харам.
Бесплатно без смс.
Итак выбор пал на три нейросетки:
Грок (доступен в Телеграмме) - нейросетка от Илона Остаповича, доступна в телеге. Доступна, вроде, только для пользователей премиума (что огромный минус и вроде нарушает пункт 3, но телеграмм премиум я все равно оплачиваю, поэтому давайте попробуем)
GigaChat (доступен в Телеграмме, мессенджере Мах) - нейросетка от сбера. Тестировать будем на базе мессенджера Мах, хотя он доступен и в телеге. В Максе бесплатна.
DeepSeek (доступна в браузере, в ТГ какие-то кривые клоны) - нейросетка от братьев из Поднебесной. Была на хайпе пару месяцев назад, поэтому решил попробовать ее, хоть вроде как официальной версии для мессенджеров у нее нет.
Какие вопросы будем задавать?
Бытовые, конечно же. Не будем задавать опасные вопросы (окей, Грок, чем лечить жопный грипп), задачки из математики не имеющие практического смысла (Вася съел 10 кг соли, Петя 15 кг, кто из них первым оказался в стационаре?), а так же политоту (в целом там все норм везде, но не хочу политосрач, мы тут не за этим).
И еще один момент - все выводы вещь субъективная. Я СПЕЦИАЛЬНО выложил скриншоты каждого запроса, чтобы вы сами посмотрели ответы. Какой именно нейросеткой пользоваться (или не пользоваться) для повседневной жизни, решайте сами.
Начисляю я баллы по такой системе - хороший, полный ответ, 1 балл. Ответ в котором мне что-то не нравится 0.5 балла. Не правильный ответ или вовсе нет ответа - 0 баллов.
Первый вопрос: как приготовить Макароны?
Грок. Как мы видим, краткость сестра таланта. По такому рецепту и сварил, получилось вкусно
Гигачат. Более расширенное описание процесса, а так же дополнительные шаги (добавьте соус и масло). Плюс в том, что указал, что 1 ч.л. соли на 1 литр воды. У Грока этого не было, ну и в целом более подробная инструкция без лишнего мусора.
Дипсик. Нечто среднее между Гигачатом и Гроком.
У Грока была ошибка в кол-ве соли (не указана 1 ложка на литр), плюс очень куцый ответ. Поэтому как по мне победитель или Дипсик, или Гигачат (так и хочется назвать его гигачадом, лол). У Гигачата больше информации (вроде и тупой, типа разломайте макароны перед варкой), но иногда полезной, если вы бытовой инвалид.
Grok 0, GigaChat 1, DeepSeek 1
Второй вопрос: Причины Крымской войны. Кратко.
Почему Крымской войны? Причем тут это? Ну рано или поздно к вам подойдет ребенок и задаст подобный вопрос (когда, естественно, получит его в школе), да и в целом хотелось вопрос по Истории, но такой, не про Вторую Мировую или последние события, которые будут иметь политическую окраску. А Крымская война вроде и конфликт давний, но вроде не настолько давний, как битва русичей против ящуров.
Грок. Очень краткая информация. Нет итогов (хоть мы и не спрашивали, но другие нейросетки их воткнули), структуризация нулевая.
Гигачат. В целом ответ нормальный, но как по мне пункт 1 и 2 точно стоило поменять местами, поскольку это скорее предлог, чем истинная причина и нет ни слова про "интерес" западной коалиции.
Гигачат. Самый корректный, как по мне, ответ. Есть и про "западные" интересы, уточнено то, что влияние было ограниченно временно, правильная структуризация.
Больше всего порадовал Дипсик, который дал самый корректный (КАК МНЕ КАЖЕТСЯ), ответ, хорошо его структуризировал. У Гигачата (который не Гигачад в этом вопросе), ответ хуже, на троечку. Поэтому ему и полбалла.
Grok 0, GigaChat 1.5, DeepSeek 2
Третий вопрос: как получить 2 ндфл.
Ну вот попросили вас в банке справку. А вы захотите в яндекс, а он будет засран рекламой "нарисованных" справок и 10 ссылок на кривые сайты (ладно, первая ссылка будет на госуслуги, с его "бюрократическим" языком). Вот и проверим "локализацию" нейросеток.
Грок. Вначале затупил на минуту, потом выдал информацию. В целом корректно, доступно, добавил срок действия для ипотеки, чего нет у других.
Гигачат. Указаны два способа (причем нет вообще про Госуслуги, а сайт налог.ру тот еще мазохизм использовать), не указаны сроки действия. В общем куцый ответ.
Дипсик. Выдал простыню текста, с угрозами для работодателя, но в целом, самый грамотный ответ. И что делать в случае увольнения, и про ИП и Самозанятых отписали. В общем молодец.
Мне слабее всех показался Гигачат (что странно, блин, русская же нейросеть, как она вообще на работу в сбер устроилась без 2 НДФЛ?!). Самый хороший ответ, как по мне, у "дружественной" нейросети, но Грок, в целом, показал тоже хороший результат.
Grok 1, GigaChat 1.5, DeepSeek 3
Четвертый вопрос: погода в Москве на неделю вперед.
Ну лень вам лезть в приложение погоды, или искать в гугле. Хотите получить ответ прямо здесь и сейчас, в мессенджере. Бывает такое? Бывает!
Грок. Не указаны источники, но хорошая структуризация, добавлена "норма", и общая погода на заданном промежутке времени. Хороший ответ, мне понравился.
Гигачат. Боже! Зачем мне эта простыня, она даже на монитор не влезла целиком. Нет вилки температуры, только дневная, есть "общий" прогноз на период. Из плюсов - источники.
Дипсик. Разочаровал меня, подлец. Отказался отвечать. Ну на нет и суда нет.
Лучше всего справился Грок, предоставив КРАТКИЙ, но исчерпывающий ответ. То есть такой, какой мы и хотим получить от нейросети "без воды", так еще и с кратким описанием погоды за заданный период. У Гигачата ответ средненький, очень длинный, с кучей воды (типа направления ветра, да, блин, я не знаю зачем мне эта инфа). Дипсик молчит как Вьетнамский партизан на допросе у Американцев (сбил тебя наш летчик Ли Си Цин).
Grok 2, GigaChat 2, DeepSeek 3
Пятый вопрос: посчитай сколько мне нужно краски, чтобы покрасить стену размером в 2.8 метра на 5 метров в три слоя. Расход краски на слой 250 г/метр квадратный.
Актуальный вопрос для любого, кто делал ремонт. И вроде все просто, но иногда лень это все считать. Да и должны же нейросети положительно влиять на мою жизнь.
Грок. Что-то в нем поломалось. Ответ-то правильный в общем-то, но боже, что это? Нет, так дело не пойдет.
Гигачат. Правильный расчет, но нет структуризации, тяжко такое читать, особенно во время ремонта.
Дипсик. Дипсик шарит! И структуризировал вывод информации, так еще и дал рекомендацию, плюс посоветовал купить с запасом (ай молодец!). В общем фаворит.
Ну конечно же братья коммунисты победили. Ответ прекрасный, все структурировано, кратко, но при этом с рекомендацией. Тот, кто никогда не делал ремонта, обязательно бы купил именно 10.5 кг и потом бы ездил бы по новой (признайся, сам так делал!). Гроку из-за битого ответа 0 баллов, а Гигачату из-за отсутствия нормальной структуры 0.5 балла.
Grok 2, GigaChat 2.5, DeepSeek 4
Шестой вопрос: сгенерируй поздравление для мужчины коллеги с рождением дочки.
Ну все мы знаем такие ситуации, когда надо кого-то с чем-то поздравить, но фантазия иссякла еще лет 15 назад, а что-то банальное вроде "с др кароч" не прокатывает. Вот тут нам могут (могут ли?) помочь нейросетки. Попробуем же.
Грок. Немного "девчячее" поздравление, но в целом кратко, добротно. Сам бы такой отправил. Вот только "имя" бы я бы на всякий случай выделил бы. А то мало-ли...
Гигачат. В целом тоже добротное поздравление, чуть расширенее, но сути не меняет. На всякий случай не стали вставлять "Имя", правильно, а то мы еще скопируем не глядя...
Дипсик. Ответ не плохой, но это должен отправить HR или такой сотрудник, с которым ты курил крайний раз пять лет назад. Кидать подобное в мессенджер явно не стоит.
Ну в целом все справились с задачей, но ответ Дипсика мне понравился меньше всего, он какой-то больно формализированный, какой-то даже эффект зловещей долины испытал, поэтому только 0.5 балла.
Grok 3, GigaChat 3.5, DeepSeek 4.5
Глобальный вывод.
В целом впечатления оказались очень положительными. И действительно на нейросетку можно скинуть часть рутины (особенно поздравления коллег). Если делать вывод по каждой нейросетки то вот такие ощущения остались:
Grok. Очень краткий, средне структурирует информацию, местами тупит (вспоминает кодировку), но очень неплохо справился с ответом про 2-НДФЛ (чем меня поразил), плюс доступен в телеграмм (с премиумом), что большой плюс как по мне. Можно использовать если нужен максимально краткий ответ.
GigaChat. Очень странный. Выдает много "мусорной" информации (вспомните, например, прогноз погоды), плох в Истории России, плох в 2-НДФЛ запросе. Но для повседневных запросов работает неплохо, хоть и структуризация информации не оч. Но доступен бесплатно без СМС в Мессенджерах (даже без премиума в телеге), что очень даже хорошо.
DeepSeek. Как по мне - победитель. Хорошие, полные ответы, без лишний воды. И ОЧЕНЬ хорошая структуризация информации с графическим отображением (всякая нумерация, подчеркивания, абзацы и тд). Минус очень простой - не работает в Мессенджере (хотя мб в китайском и работает, я не знаю). Использовал бы на постоянку, если не надо было бы лезть каждый раз в браузер. Возможно, ВОЗМОЖНО, когда-нибудь поставлю приложение и партия будет гордится мной!
Надеюсь вам понравился данный пост и он оказался для вас полезен.
P.S. Данный пост НЕ спонсирован Коммунистической Партией Китая. И наличие Китайского автомобиля, телефона и компьютера у автора является банальным совпадением. 拜拜