Яндекс, может стоит нанять пару тестеров, чтобы они вам тест-кейсы составили
UPD Спасибо за информацию в комментах, что "это же нейронка, она не умеет считать"
Проблемка в том, что эту ересь выдает главная страница поисковика. На вскидку, можно натренировать нейронку при определенных запросах передавать управление скрипту, который умеет считать или не отвечать на вопрос, на который ответить не получается. Заглушки на вопросы касающиеся этики модели умеют выдавать отлично. Если тут нет такой заглушки, значит разработчики считают, что модель может и умеет давать ответ.