নতুন প্রযুক্তির মাধ্যমে ওপেনএআই-এর চ্যাটবট ক্রমাগত উন্নত হচ্ছে। ছবি: নিউ ইয়র্ক টাইমস । |
২০২৪ সালের সেপ্টেম্বরে, OpenAI ChatGPT চালু করে, যা AI-এর একটি সংস্করণ যা o1 মডেলকে একীভূত করে, যা গণিত, বিজ্ঞান এবং কম্পিউটার প্রোগ্রামিং সম্পর্কিত কাজে যুক্তি দিতে সক্ষম।
ChatGPT-এর পূর্ববর্তী সংস্করণের বিপরীতে, নতুন প্রযুক্তিটি প্রতিক্রিয়া দেওয়ার আগে জটিল সমস্যার সমাধান সম্পর্কে "চিন্তা" করতে সময় নেবে।
ওপেনএআই-এর পরে, গুগল, অ্যানথ্রপিক এবং ডিপসিকের মতো অনেক প্রতিযোগীও একই ধরণের যুক্তি মডেল চালু করেছে। যদিও এটি নিখুঁত নয়, তবুও এটি একটি চ্যাটবট আপগ্রেড প্রযুক্তি যা অনেক ডেভেলপার বিশ্বাস করে।
AI কীভাবে কারণ দেখায়
মূলত, যুক্তির অর্থ হল চ্যাটবটগুলি ব্যবহারকারীদের দ্বারা উত্থাপিত সমস্যাগুলি সমাধান করার জন্য আরও বেশি সময় ব্যয় করতে পারে।
"যুক্তি হলো প্রশ্ন পাওয়ার পর সিস্টেমটি কীভাবে অতিরিক্ত কাজ করে," ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানের অধ্যাপক ড্যান ক্লেইন নিউ ইয়র্ক টাইমসকে বলেন।
যুক্তির একটি পদ্ধতি একটি সমস্যাকে অনেকগুলি পৃথক ধাপে বিভক্ত করতে পারে, অথবা চেষ্টা এবং ত্রুটির মাধ্যমে সমাধান করতে পারে।
প্রথমবার চালু হলে, ChatGPT তথ্য আহরণ এবং সংশ্লেষণের মাধ্যমে তাৎক্ষণিকভাবে প্রশ্নের উত্তর দিতে পারত। বিপরীতে, যুক্তি ব্যবস্থার সমস্যা সমাধান এবং প্রতিক্রিয়া প্রদানের জন্য আরও কয়েক সেকেন্ড (অথবা এমনকি মিনিট) প্রয়োজন ছিল।
![]() |
একটি গ্রাহক পরিষেবা চ্যাটবটে o1 মডেলের যুক্তি প্রক্রিয়ার একটি উদাহরণ। ছবি: OpenAI । |
কিছু ক্ষেত্রে, যুক্তি ব্যবস্থা সমস্যার প্রতি তার দৃষ্টিভঙ্গি পরিবর্তন করবে, সমাধানের ধারাবাহিক উন্নতি করবে। অতিরিক্তভাবে, মডেলটি সর্বোত্তম পছন্দ করার আগে একাধিক সমাধান পরীক্ষা করতে পারে, অথবা পূর্ববর্তী প্রতিক্রিয়াগুলির নির্ভুলতা পরীক্ষা করতে পারে।
সাধারণভাবে, যুক্তি ব্যবস্থা প্রশ্নের সম্ভাব্য সকল উত্তর বিবেচনা করবে। এটি প্রাথমিক বিদ্যালয়ের শিক্ষার্থীরা গণিত সমস্যার সবচেয়ে উপযুক্ত সমাধান বেছে নেওয়ার আগে কাগজে অনেক বিকল্প লিখে রাখার মতো।
নিউ ইয়র্ক টাইমসের মতে, এআই এখন প্রায় যেকোনো বিষয়ে যুক্তি দিতে সক্ষম। তবে, গণিত, বিজ্ঞান এবং কম্পিউটার প্রোগ্রামিং সম্পর্কিত প্রশ্নগুলির ক্ষেত্রে এটি সবচেয়ে কার্যকর হবে।
তাত্ত্বিক ব্যবস্থা কীভাবে প্রশিক্ষিত হয়?
একটি সাধারণ চ্যাটবটে, ব্যবহারকারীরা এখনও প্রক্রিয়াটির ব্যাখ্যা অনুরোধ করতে পারেন বা প্রতিক্রিয়ার সঠিকতা যাচাই করতে পারেন। আসলে, অনেক ChatGPT প্রশিক্ষণ ডেটাসেটে ইতিমধ্যেই সমস্যা সমাধানের পদ্ধতি অন্তর্ভুক্ত রয়েছে।
যুক্তি ব্যবস্থা আরও উন্নত হয়ে ওঠে যখন এটি ব্যবহারকারীর মতামত ছাড়াই কাজ করতে পারে। এই প্রক্রিয়াটি আরও জটিল এবং বিস্তৃত। কোম্পানিগুলি "যুক্তি" শব্দটি ব্যবহার করে কারণ এই ব্যবস্থাটি মানুষের চিন্তাভাবনার মতোই কাজ করে।
OpenAI-এর মতো অনেক কোম্পানি আশা করে যে বর্তমানে উপলব্ধ চ্যাটবটগুলিকে উন্নত করার জন্য যুক্তি ব্যবস্থাই সেরা সমাধান হবে। বছরের পর বছর ধরে, তারা বিশ্বাস করত যে চ্যাটবটগুলি ইন্টারনেটে যত বেশি তথ্য প্রশিক্ষণ পাবে তত বেশি ভালো পারফর্ম করবে।
২০২৪ সালের মধ্যে, এআই সিস্টেমগুলি ইন্টারনেটে উপলব্ধ প্রায় সমস্ত লেখা ব্যবহার করে ফেলবে। এর অর্থ হল কোম্পানিগুলিকে চ্যাটবট আপগ্রেড করার জন্য নতুন সমাধান খুঁজে বের করতে হবে, যার মধ্যে যুক্তি সিস্টেমও অন্তর্ভুক্ত রয়েছে।
![]() |
স্টার্টআপ ডিপসিক একবার তাদের যুক্তিসঙ্গত মডেল নিয়ে আলোড়ন তুলেছিল যা ওপেনএআই-এর চেয়ে সস্তা ছিল। ছবি: ব্লুমবার্গ । |
গত বছর থেকে, OpenAI-এর মতো কোম্পানিগুলি রিইনফোর্সমেন্ট লার্নিং কৌশলের উপর মনোযোগ দিয়েছে। এই প্রক্রিয়াটি সাধারণত বেশ কয়েক মাস সময় নেয়, এই সময়কালে AI পরীক্ষা এবং ত্রুটির মাধ্যমে আচরণ শেখে।
উদাহরণস্বরূপ, হাজার হাজার সমস্যার সমাধান করে, সিস্টেমটি সঠিক উত্তরে পৌঁছানোর সর্বোত্তম পদ্ধতিটি সনাক্ত করতে পারে। সেখান থেকে, গবেষকরা অত্যাধুনিক প্রতিক্রিয়া প্রক্রিয়া তৈরি করেন যা সিস্টেমকে সঠিক এবং ভুল সমাধানের মধ্যে পার্থক্য করতে সহায়তা করে।
"এটা অনেকটা কুকুরকে প্রশিক্ষণ দেওয়ার মতো। যদি সিস্টেমটি ভালোভাবে কাজ করে, তাহলে তুমি তাকে ট্রিট দেবে। অন্যথায়, তুমি বলবে, 'ওই কুকুরটি দুষ্টু,'" ওপেনএআই-এর একজন গবেষক জেরি টোওরেক শেয়ার করেছেন।
AI কি ভবিষ্যৎ?
নিউ ইয়র্ক টাইমসের মতে, গণিত, বিজ্ঞান এবং কম্পিউটার প্রোগ্রামিংয়ের প্রয়োজনীয়তা মোকাবেলায় রিইনফোর্সমেন্ট লার্নিং কৌশল কার্যকর। এই ক্ষেত্রগুলিতে সঠিক বা ভুল উত্তরগুলি স্পষ্টভাবে সংজ্ঞায়িত করা যেতে পারে।
বিপরীতভাবে, লেখালেখি, দর্শন বা নীতিশাস্ত্রের ক্ষেত্রে শক্তিবৃদ্ধি শেখা অকার্যকর - এমন ক্ষেত্র যেখানে ভাল এবং খারাপের মধ্যে পার্থক্য করা কঠিন। তবুও, গবেষকরা দাবি করেন যে এই কৌশলটি এখনও অ-গাণিতিক প্রশ্নগুলির সাথেও AI কর্মক্ষমতা উন্নত করতে পারে।
"সিস্টেমগুলি ইতিবাচক এবং নেতিবাচক ফলাফলের দিকে পরিচালিত করার পথগুলি শিখবে," অ্যানথ্রপিকের প্রধান বৈজ্ঞানিক কর্মকর্তা জ্যারেড কাপলান বলেছেন।
![]() |
ক্লড এআই মডেলের মালিকানাধীন স্টার্টআপ অ্যানথ্রপিকের ওয়েবসাইট। ছবি: ব্লুমবার্গ । |
এটা মনে রাখা গুরুত্বপূর্ণ যে রিইনফোর্সমেন্ট লার্নিং এবং রিজনিং সিস্টেম দুটি ভিন্ন ধারণা। বিশেষ করে, রিইনফোর্সমেন্ট লার্নিং হল রিজনিং সিস্টেম তৈরির একটি পদ্ধতি। চ্যাটবটগুলিকে যুক্তি শেখার জন্য এটি চূড়ান্ত প্রশিক্ষণ পর্যায়।
যেহেতু এটি এখনও তুলনামূলকভাবে নতুন, বিজ্ঞানীরা এখনও নিশ্চিত হতে পারেননি যে চ্যাটবট যুক্তি বা শক্তিবৃদ্ধি শেখা AI কে মানুষের মতো চিন্তা করতে সাহায্য করতে পারে কিনা। এটি লক্ষ করা উচিত যে অনেক বর্তমান AI প্রশিক্ষণের প্রবণতা শুরুতে খুব দ্রুত বিকশিত হয় এবং তারপর ধীরে ধীরে ধীর হয়ে যায়।
তদুপরি, চ্যাটবট যুক্তি এখনও ভুল করতে পারে। সম্ভাব্যতার উপর ভিত্তি করে, সিস্টেমটি এমন প্রক্রিয়াটি বেছে নেবে যা এটি শেখা তথ্যের সাথে সবচেয়ে বেশি সাদৃশ্যপূর্ণ, ইন্টারনেট থেকে হোক বা রিইনফোর্সমেন্ট লার্নিংয়ের মাধ্যমে। অতএব, চ্যাটবটগুলি এখনও ভুল বা অযৌক্তিক সমাধান বেছে নিতে পারে।
সূত্র: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html










মন্তব্য (0)