নতুন প্রযুক্তির মাধ্যমে ওপেনএআই-এর চ্যাটবট ক্রমাগত উন্নত হচ্ছে। ছবি: নিউ ইয়র্ক টাইমস । |
২০২৪ সালের সেপ্টেম্বরে, OpenAI ChatGPT-এর একটি সংস্করণ প্রকাশ করে যা o1 মডেলকে একীভূত করে, যা গণিত, বিজ্ঞান এবং কম্পিউটার প্রোগ্রামিং সম্পর্কিত কাজগুলিতে যুক্তি দিতে পারে।
ChatGPT-এর পূর্ববর্তী সংস্করণের বিপরীতে, নতুন প্রযুক্তিটি প্রতিক্রিয়া দেওয়ার আগে জটিল সমস্যার সমাধান সম্পর্কে "চিন্তা" করতে সময় নেবে।
ওপেনএআই-এর পর, গুগল, অ্যানথ্রপিক এবং ডিপসিকের মতো অনেক প্রতিযোগীও একই ধরণের যুক্তি মডেল চালু করেছে। যদিও এটি নিখুঁত নয়, তবুও এটি একটি চ্যাটবট বর্ধিতকরণ প্রযুক্তি যা অনেক ডেভেলপার বিশ্বাস করে।
কিভাবে AI কারণ
মূলত, যুক্তি বলতে বোঝায় যে চ্যাটবট ব্যবহারকারীর দ্বারা উপস্থাপিত সমস্যা সমাধানে আরও বেশি সময় ব্যয় করতে পারে।
"যুক্তি হল প্রশ্ন পাওয়ার পর সিস্টেমটি কীভাবে অতিরিক্ত কাজ করে," ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক ড্যান ক্লেইন নিউ ইয়র্ক টাইমসকে বলেন।
যুক্তি ব্যবস্থা একটি সমস্যাকে পৃথক ধাপে বিভক্ত করতে পারে, অথবা চেষ্টা এবং ত্রুটির মাধ্যমে সমাধান করতে পারে।
যখন এটি প্রথম চালু হয়েছিল, তখন ChatGPT তথ্য আহরণ এবং সংশ্লেষণের মাধ্যমে তাৎক্ষণিকভাবে প্রশ্নের উত্তর দিতে পারত। এদিকে, যুক্তি ব্যবস্থার সমস্যা সমাধান এবং প্রতিক্রিয়া জানাতে আরও কয়েক সেকেন্ড (অথবা এমনকি মিনিট) প্রয়োজন ছিল।
![]() |
কাস্টমার কেয়ার চ্যাটবটে o1 মডেলের যুক্তি প্রক্রিয়ার উদাহরণ। ছবি: OpenAI । |
কিছু ক্ষেত্রে, যুক্তি ব্যবস্থা সমস্যার প্রতি তার দৃষ্টিভঙ্গি পরিবর্তন করবে, সমাধানের উন্নতি করবে। বিকল্পভাবে, মডেলটি সর্বোত্তম পছন্দটি স্থির করার আগে একাধিক সমাধান চেষ্টা করতে পারে, অথবা পূর্ববর্তী প্রতিক্রিয়াগুলির নির্ভুলতা পরীক্ষা করতে পারে।
সাধারণভাবে, যুক্তি ব্যবস্থা প্রশ্নের সম্ভাব্য সকল উত্তর বিবেচনা করবে। এটি এমন যে, একজন প্রাথমিক বিদ্যালয়ের শিক্ষার্থী গণিতের সমস্যা সমাধানের সবচেয়ে উপযুক্ত উপায় বেছে নেওয়ার আগে একটি কাগজের টুকরোতে অনেকগুলি সম্ভাব্য উত্তর লিখে ফেলে।
নিউ ইয়র্ক টাইমসের মতে, কৃত্রিম বুদ্ধিমত্তা এখন যেকোনো বিষয়ে যুক্তি দিতে সক্ষম। তবে, গণিত, বিজ্ঞান এবং কম্পিউটার প্রোগ্রামিং সম্পর্কিত প্রশ্নগুলির ক্ষেত্রে কাজটি সবচেয়ে কার্যকর হবে।
তাত্ত্বিক ব্যবস্থা কীভাবে প্রশিক্ষিত হয়?
একটি সাধারণ চ্যাটবটে, ব্যবহারকারীরা এখনও প্রক্রিয়াটির ব্যাখ্যা চাইতে পারেন অথবা প্রতিক্রিয়ার সঠিকতা পরীক্ষা করতে পারেন। আসলে, অনেক ChatGPT প্রশিক্ষণ ডেটাসেটে ইতিমধ্যেই একটি সমস্যা সমাধান প্রক্রিয়া অন্তর্ভুক্ত থাকে।
একটি যুক্তি ব্যবস্থা আরও বেশি এগিয়ে যায় যখন এটি ব্যবহারকারীর জিজ্ঞাসা ছাড়াই কোনও কাজ সম্পাদন করতে পারে। এই প্রক্রিয়াটি আরও জটিল এবং সুদূরপ্রসারী। কোম্পানিগুলি "যুক্তি" শব্দটি ব্যবহার করে কারণ এই ব্যবস্থাটি মানুষের চিন্তাভাবনার মতোই কাজ করে।
OpenAI-এর মতো অনেক কোম্পানি বাজি ধরছে যে চ্যাটবটগুলিকে উন্নত করার জন্য যুক্তি ব্যবস্থাই সর্বোত্তম উপায়। বছরের পর বছর ধরে, তারা বিশ্বাস করত যে চ্যাটবটগুলি আরও ভাল কাজ করবে যদি তাদের ইন্টারনেটে যতটা সম্ভব তথ্য সম্পর্কে প্রশিক্ষণ দেওয়া হয়।
২০২৪ সালের মধ্যে, এআই সিস্টেমগুলি ইন্টারনেটে উপলব্ধ প্রায় সমস্ত লেখা গ্রাস করে ফেলবে। এর অর্থ হল কোম্পানিগুলিকে চ্যাটবট আপগ্রেড করার জন্য নতুন সমাধান খুঁজে বের করতে হবে, যার মধ্যে যুক্তি সিস্টেমও অন্তর্ভুক্ত থাকবে।
![]() |
স্টার্টআপ ডিপসিক একবার ওপেনএআই-এর চেয়ে কম খরচের একটি যুক্তিসঙ্গত মডেল নিয়ে "আলোড়ন সৃষ্টি করেছিল"। ছবি: ব্লুমবার্গ । |
গত বছর থেকে, OpenAI-এর মতো কোম্পানিগুলি রিইনফোর্সমেন্ট লার্নিং নামক একটি কৌশলের উপর মনোনিবেশ করেছে, একটি প্রক্রিয়া যা সাধারণত বেশ কয়েক মাস সময় নেয়, যেখানে AI পরীক্ষা এবং ত্রুটির মাধ্যমে আচরণ শেখে।
উদাহরণস্বরূপ, হাজার হাজার সমস্যার সমাধান করে, সিস্টেমটি সঠিক উত্তর পাওয়ার সর্বোত্তম পদ্ধতি শিখতে পারে। সেখান থেকে, গবেষকরা জটিল প্রতিক্রিয়া প্রক্রিয়া তৈরি করেছেন যা সিস্টেমটিকে সঠিক এবং ভুল সমাধান শিখতে সাহায্য করে।
"এটা একটা কুকুরকে প্রশিক্ষণ দেওয়ার মতো। যদি ভালো হয়, তাহলে তুমি তাকে একটা ট্রিট দেবে। যদি খারাপ হয়, তাহলে তুমি বলবে, 'ওই কুকুরটা খারাপ,'" ওপেনএআই-এর একজন গবেষক জেরি টোরেক বলেন।
AI কি ভবিষ্যৎ?
নিউ ইয়র্ক টাইমসের মতে, গণিত, বিজ্ঞান এবং কম্পিউটার প্রোগ্রামিং-এর প্রশ্নগুলির সাথে রিইনফোর্সমেন্ট লার্নিং ভালোভাবে কাজ করে, যেখানে সঠিক বা ভুল উত্তর স্পষ্টভাবে সংজ্ঞায়িত করা হয়।
বিপরীতে, সৃজনশীল লেখালেখি, দর্শন বা নীতিশাস্ত্রের ক্ষেত্রে শক্তিবৃদ্ধি শিক্ষা ততটা কার্যকর নয়, যেখানে ভালো এবং খারাপের মধ্যে পার্থক্য করা কঠিন। কিন্তু গবেষকরা বলছেন যে এই কৌশলটি এখনও AI কর্মক্ষমতা উন্নত করতে পারে, এমনকি গণিতের বাইরের প্রশ্নেও।
"সিস্টেমগুলি ইতিবাচক এবং নেতিবাচক ফলাফলের দিকে পরিচালিত করার পথগুলি শিখবে," অ্যানথ্রপিকের প্রধান বিজ্ঞান কর্মকর্তা জ্যারেড কাপলান বলেছেন।
![]() |
কৃত্রিম বুদ্ধিমত্তা (এআই) মডেল ক্লডের মালিকানাধীন স্টার্টআপ অ্যানথ্রপিকের ওয়েবসাইট। ছবি: ব্লুমবার্গ । |
এটা মনে রাখা গুরুত্বপূর্ণ যে রিইনফোর্সমেন্ট লার্নিং এবং রিজনিং সিস্টেম দুটি ভিন্ন ধারণা। বিশেষ করে, রিইনফোর্সমেন্ট লার্নিং হল রিজনিং সিস্টেম তৈরির একটি পদ্ধতি। চ্যাটবটগুলির যুক্তি ক্ষমতা অর্জনের জন্য এটি চূড়ান্ত প্রশিক্ষণের পর্যায়।
যেহেতু এগুলি এখনও তুলনামূলকভাবে নতুন, বিজ্ঞানীরা নিশ্চিত হতে পারছেন না যে যুক্তিযুক্ত চ্যাটবট বা শক্তিবৃদ্ধি শেখা AI কে মানুষের মতো চিন্তা করতে সাহায্য করতে পারে কিনা। এটা মনে রাখা গুরুত্বপূর্ণ যে AI প্রশিক্ষণের অনেক বর্তমান প্রবণতা শুরুতে খুব দ্রুত বিকশিত হয় এবং তারপর ধীরে ধীরে সমান হয়ে যায়।
তদুপরি, যুক্তিযুক্ত চ্যাটবটগুলি এখনও ভুল করতে পারে। সম্ভাব্যতার উপর ভিত্তি করে, সিস্টেমটি এমন প্রক্রিয়াটি বেছে নেবে যা এটি শেখা তথ্যের সাথে সবচেয়ে সাদৃশ্যপূর্ণ, তা সে ইন্টারনেট থেকে আসুক বা পুনর্বহাল শিক্ষার মাধ্যমে আসুক। অতএব, চ্যাটবটগুলি এখনও ভুল বা অযৌক্তিক সমাধান বেছে নিতে পারে।
সূত্র: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html













মন্তব্য (0)