Вьетнам является вторым по величине экспортером кофе в мире и поставляет более половины мирового объема поставок робусты. Ожидается, что объем производства кофе в 2022/23 сельскохозяйственном году достигнет 29,75 млн мешков, из которых более 95% составит робуста.
В ежегодном обзоре Международной организации кофе за 2021/2022 год Вьетнам занял первое место по урожайности кофе с показателем 2,4 тонны/га. Производство кофе во Вьетнаме осуществляется из зерен сортов Робуста, Арабика, Черри, Мока и Кули, которые являются самыми популярными кофейными зернами, выращиваемыми во Вьетнаме.
Однако цены на сельскохозяйственную продукцию в целом и на кофейные зерна в частности часто нестабильны и могут резко колебаться в периоды высоких урожаев, что существенно влияет на доходы фермеров и наносит ущерб экономике .
Слева направо: студенты факультета науки , техники и технологий RMIT: Лам Тин Дьеу, Нгуен Хай Минь Чанг, Нгуен Фуонг Нам (верхний ряд), Ле Нгок Нгуен Туан, Доан Чан Тонг (нижний ряд)
Слева направо: студенты факультета науки, техники и технологий RMIT: Лам Тин Дьеу, Нгуен Хай Минь Чанг, Нгуен Фуонг Нам (верхний ряд), Ле Нгок Нгуен Туан, Доан Чан Тонг (нижний ряд)
Для поиска решения этой проблемы в течение четырех месяцев группа студентов выпускного курса факультета естественных наук, инженерии и технологий, специализирующихся на информационных технологиях, в том числе Нгуен Хай Минь Транг, Доан Чань Тхонг, Ле Нгок Нгуен Туан, Нгуен Фыонг Нам и Лам Тин Дьеу, обучили и оценили шесть моделей машинного обучения (МО) для прогнозирования цен на кофе, которые могут помочь вьетнамским фермерам принимать обоснованные решения относительно своих урожаев и соответствующим образом планировать свою деятельность, оптимизируя прибыль и минимизируя убытки.
«Мы разработали шесть моделей машинного обучения, а именно LSTM, GRU, ARIMA, SARIMA, SVM и RF, на основе истории цен на кофе, цен на бензин, температуры и количества осадков, чтобы спрогнозировать цены на кофе робуста в провинции Ламдонг, и обнаружили, что модель RF, использующая весь набор данных, оказалась наиболее эффективной», — сказал Транг.
Среди 6 моделей машинного обучения наилучшие результаты показала модель RF, использующая весь набор данных.
«RF может включать более богатые наборы данных и обрабатывать нелинейные связи. Кроме того, цена на топливо оказалась значимым предиктором и превзошла все остальные протестированные функции вместе взятые».
Группа подчеркнула, что модель имеет потенциал для дальнейшего совершенствования за счет изучения и учета влияния урожайности, рыночных тенденций и геополитических событий на цены на сельскохозяйственную продукцию.
Каждый член команды сталкивается с различными трудностями в ходе проекта, такими как отсутствие глубокого понимания различных моделей машинного обучения, необходимость эффективно донести сложность своей работы до области искусственного интеллекта или необходимость управления временем и коммуникацией при удаленной работе. Однако, вкладывая значительное количество времени в исследования, углубляясь в научные статьи, связанные с ИИ и машинным обучением, а также совершенствуя свои технические и навыки совместной работы, вы улучшаете свои навыки исследования ИИ для решения реальных проблем и можете развивать исследования своей команды в реальные продукты.
«Главной проблемой для нас был сбор и интеграция данных», — поделился Туан.
«Хотя разработка модели была довольно простой, значительное время, необходимое для сбора и объединения данных, представляло для нас огромную проблему. Каждый член команды прошел кривую обучения и повысил свои навыки как в технической, так и в проектной координации, от углубленных исследований до продвижения инноваций и разработки новых решений».
На момент проведения исследования Нам работал в Ханое и имел постоянную занятость. По словам Нама, для предотвращения задержек и возможных сбоев команда организовала еженедельные совещания и поддерживала регулярную связь, чтобы мотивировать друг друга не сбиваться с пути и качественно выполнять поставленную задачу.
За главным проектом команды пристально следили преподаватели Школы науки, техники и технологий Королевского королевского технологического института во Вьетнаме. Результаты проекта были недавно представлены на престижном международном мероприятии — 8-й Международной конференции IEEE/ACIS по большим данным, облачным вычислениям и инжинирингу науки о данных (BCD 2023) — совместно с исследователями, учеными, инженерами, экспертами в области больших данных, облачных вычислений и науки о данных.
Студент Нгуен Фыонг Нам демонстрирует, как работает сайт-симуляция цен на кофе
Команда планирует усовершенствовать модели на основе отзывов, полученных в ходе презентаций на конференции, а также изучить другие подходы для повышения точности и применимости своих прогнозов.
«Мы планируем глубже изучить передовые технологии и новые методы в этой области, чтобы еще больше закрепить результаты исследований, достигнутых нашей командой», — сказал Тонг.
«Кроме того, мы планируем сотрудничать с другими экспертами в этой области и изучать потенциальные партнерства для расширения сферы охвата и влияния результатов исследований группы».
Команда планирует продолжить итерацию и модернизацию исследования, чтобы внести практический вклад в постоянно развивающуюся область больших данных и искусственного интеллекта на основе вашего конкретного исследования.
Ссылка на источник
Комментарий (0)