Вьетнам является вторым по величине экспортёром кофе в мире и поставляет более половины мирового объёма робусты. Ожидается, что производство кофе в 2022/23 сельскохозяйственном году достигнет 29,75 млн мешков, из которых более 95% составит робуста.
В ежегодном обзоре Международной организации по кофе за 2021/2022 год Вьетнам занял первое место по урожайности кофе с показателем 2,4 тонны с гектара. Производство кофе во Вьетнаме представлено зёрнами робусты, арабики, черри, мокко и кули — самых популярных сортов кофе, выращиваемых во Вьетнаме.
Однако цены на сельскохозяйственную продукцию в целом и на кофейные зерна в частности часто нестабильны и могут резко колебаться в периоды высоких урожаев, что существенно влияет на доходы фермеров и наносит ущерб экономике .
Слева направо: студенты факультета науки , техники и технологий RMIT: Лам Тин Дьеу, Нгуен Хай Минь Чанг, Нгуен Фуонг Нам (верхний ряд), Ле Нгок Нгуен Туан, Доан Чан Тонг (нижний ряд)
Слева направо: студенты факультета науки, техники и технологий RMIT: Лам Тин Дьеу, Нгуен Хай Минь Чанг, Нгуен Фуонг Нам (верхний ряд), Ле Нгок Нгуен Туан, Доан Чан Тонг (нижний ряд)
Чтобы найти решение этой проблемы, в течение четырех месяцев группа студентов выпускного курса, специализирующихся на информационных технологиях факультета естественных наук, техники и технологий, в том числе Нгуен Хай Минь Транг, Доан Чань Тхонг, Ле Нгок Нгуен Туан, Нгуен Фыонг Нам и Лам Тин Дьеу, обучили и оценили шесть моделей машинного обучения (МО) для прогнозирования цен на кофе, которые могут помочь вьетнамским фермерам принимать обоснованные решения в отношении своих культур и соответствующим образом планировать производство, оптимизируя прибыль и минимизируя потери.
«Мы разработали шесть моделей машинного обучения, а именно LSTM, GRU, ARIMA, SARIMA, SVM и RF, на основе истории цен на кофе, цен на бензин, температуры и количества осадков, чтобы спрогнозировать цены на кофе робуста в провинции Ламдонг, и обнаружили, что модель RF, использующая весь набор данных, оказалась наиболее эффективной», — сказал Транг.
Среди 6 моделей машинного обучения наилучшие результаты показала модель RF, использующая весь набор данных.
«RF может включать более обширные наборы данных и обрабатывать нелинейные зависимости. Кроме того, цена на топливо оказалась значимым предиктором и превзошла все остальные протестированные характеристики вместе взятые».
Группа экспертов подчеркнула, что модель имеет потенциал для дальнейшего совершенствования за счет изучения и учета влияния урожайности сельскохозяйственных культур, рыночных тенденций и геополитических событий на цены на сельскохозяйственную продукцию.
Каждый член команды столкнулся с различными трудностями в ходе проекта, такими как недостаточное понимание различных моделей машинного обучения, неспособность эффективно донести сложность своей работы до специалистов в области искусственного интеллекта (ИИ) или неумение распоряжаться временем и коммуникацией при удалённой работе. Однако, уделяя значительное время исследованиям, углубляясь в научные статьи, связанные с ИИ и машинным обучением, а также совершенствуя свои технические навыки и навыки совместной работы, они улучшили свои навыки исследования ИИ для решения реальных задач и смогли развить исследования своей команды до уровня реальных продуктов.
«Главной проблемой для нас был сбор и интеграция данных», — поделился Туан.
«Разработка модели была довольно простой, но значительное время, необходимое для сбора и объединения данных, представляло для нас серьёзную проблему. Каждый член команды прошёл определённый путь обучения и усовершенствовал свои навыки как в технической сфере, так и в координации проектов, от глубоких исследований до внедрения инноваций и разработки новых решений».
На момент проведения исследования Нам работал в Ханое на полную ставку. По словам Нама, чтобы избежать задержек и возможных сбоев, команда проводила еженедельные совещания и поддерживала регулярную связь, чтобы мотивировать друг друга не сбиваться с пути и выполнять поставленную задачу.
Завершающий проект команды проходил под пристальным наблюдением преподавателей Школы естественных наук, инженерии и технологий Королевского технологического института Вьетнама (RMIT). Результаты проекта были недавно представлены на престижном международном мероприятии – 8-й Международной конференции IEEE/ACIS по большим данным, облачным вычислениям и инженерии науки о данных (BCD 2023) – с участием исследователей, учёных, инженеров и экспертов в области больших данных, облачных вычислений и науки о данных.
Студент Нгуен Фыонг Нам демонстрирует, как работает сайт моделирования цен на кофе
Команда планирует усовершенствовать модели на основе отзывов, полученных в ходе презентаций на конференции, а также изучить другие подходы для повышения точности и применимости своих прогнозов.
«Мы планируем глубже изучить передовые технологии и новые методы в этой области, чтобы еще больше закрепить результаты исследований, достигнутых нашей командой», — сказал Тонг.
«Кроме того, мы планируем сотрудничать с другими экспертами в этой области и изучать потенциальные партнерства для расширения масштабов и влияния результатов исследований группы».
Команда планирует продолжить итерацию и совершенствование исследований, чтобы внести практический вклад в постоянно развивающуюся область больших данных и искусственного интеллекта на основе вашего конкретного исследования.
Ссылка на источник
Комментарий (0)