👀 ЗАСТАВИМ МОДЕЛЬ СЧИТАТЬ ОБЪЕКТЫ НА КАРТИНКАХ* 👁
У нас есть датасет с картинками, на которых изображены различные объекты. С помощью мультимодальной модели попробуйте определить точное количество определённых объектов на картинках.
Пример изображения:

Что делать? Ответьте на вопросы по картинкам с помощью ЛЛМки.
                                  Запишите ответы в столбец answer (только ответ, во всех задачах это целые
                                  числа).
Что на входе? Вам предоставляется датасет со столбцами question,
                                  answer, image_name.
                                
Столбец image_name указывает на название картинки по которой мы хотим
                                  получить ответ на вопрос.
Подгрузить датасет можно следующим образом:
import pandas as pd
df = pd.read_csv("https://stepik.org/media/attachments/lesson/1028705/mulimodal_questions.csv")Картинки можно получить командой:
!wget https://stepik.org/media/attachments/lesson/1028705/images.zipЧто на выходе? csv файл, содержащий два столбца -
                                  question,  answer.
                                  Замечание: Ваше решение будет зачтено, если в нём будет минимум 8
                                  правильных ответов.
                                
Начать решать можно в ноутбуке по ссылке.