и спустя несколько дней эксперементов, понял, что для такого большого датасета - мало памяти у видях. Нашел предобученную модель и развернул, а т.к. 7806 растений это мало, я вдогонку подключил еще нейронку натренированную на данных iNaturalist. Так что теперь не только растения, но и животные и даже рыбов могет определять. Но естественно не все
А тепер перейдем к самой мякушке.
без арендованного забугорного сервера в Нидерландах, я не смог скачать ничего, ни датасета, ни модели
Ну вы поняли...
И тот факт, что модели еще можно дообучить или вообще переобучить на своём датасете, в месте с тем фактом, что там еще есть куда стремиться, натолкнул меня на несколько важных мыслей, а именно:
1. Они там за бугром чо, охренели доступ ограничивать? Получается, я не имею доступ к научным данным просто по праву рождения в своей стране??? (Рассуждает про нацизм)
2. Я хочу дополнять собранные датасеты, и для этого мне нужен сервер, мой, личный, который я пока потихой собираю.
3. Я хочу в перспективе, подкопить данные датасета, и переобучить модель. А лучше, сделать этот процесс постоянным, и чтобы могли участвавать все желающие
_
Таким образом я внесу вклад в развитие науки (как бы наивно и по детски это ни звучало) и обеспечу суверенность и независиость знаний.
А что касается Яндекса, то это фиаско братан. Это просто былинный отказ. Имея ваши ресурсы, имея ваши наработки с поисковой системой, разве трудно собрать свой датасет??? Разве трудно на серверах с видяхами натравить скрипт с той-же blip2 или че по веселее, чтобы оно вам изображения из поиска по папкам складывало??? Разве для вас обучить потом болшую модель на этих данных это проблема???? Собрали свои данные, сделали сетку и вы в шоколаде... А я как вижу у них там похоже датасет банально общедоступный просто тьфу, халтура
Вот ссылка на мою поделку если что. Я там делаю что попало, но как минимум диалог с DeepSeek можно вести голосом, и растения распознает. Плюс я его развиваю по мере возможностей
https://t.me/DigitalWeed_ai_bot