GPT-4.5 হল OpenAI-এর তৈরি সবচেয়ে বড় মডেল। সূত্র: দ্য ভার্জ । |
ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের জ্ঞানীয় বিজ্ঞান বিভাগের একটি নতুন গবেষণা কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে একটি মাইলফলক চিহ্নিত করেছে: OpenAI-এর GPT-4.5 মডেলটি "ব্যক্তিত্ব"-ভিত্তিক মিথস্ক্রিয়া পদ্ধতি ব্যবহার করে টুরিং পরীক্ষায় উচ্চতর কর্মক্ষমতা অর্জন করেছে।
এটিকে এখন পর্যন্ত সবচেয়ে মানুষের মতো কৃত্রিম বুদ্ধিমত্তা (AI) কথোপকথন ব্যবস্থা হিসেবে বিবেচনা করা হয়, যা সামাজিক বুদ্ধিমত্তার ক্ষেত্রে অনেক সম্ভাব্য প্রয়োগের দ্বার উন্মোচন করে।
ওপেনএআই জিপিটি-৪.৫ কে "প্রাক-প্রশিক্ষণ এবং প্রশিক্ষণ পরবর্তী স্কেলিংয়ের ক্ষেত্রে একটি বড় অগ্রগতি" হিসাবে বিল করেছে। এটি ওপেনএআই-এর তৈরি সর্ববৃহৎ মডেল, যার আকার এবং গণনা ক্ষমতা পূর্ববর্তী সংস্করণগুলিকে ছাড়িয়ে গেছে।
২৭শে ফেব্রুয়ারি OpenAI-এর অফিসিয়াল ব্লগ পোস্ট অনুসারে, GPT-4.5 ঘোষণার দিন থেকেই ChatGPT Pro ব্যবহারকারীদের কাছে রোল আউট করা শুরু হয়েছে।
কৃত্রিম বুদ্ধিমত্তা কি মানুষকে বোকা বানাতে পারে?
এই পরীক্ষায় চারটি প্রতিনিধিত্বমূলক AI সিস্টেমের তুলনা করা হয়েছে: 1960-এর দশকের চ্যাটবট ELIZA, Meta AI-এর LLaMa-3.1-405B, এবং OpenAI-এর GPT-4o এবং GPT-4.5। দলটি Prolific-এর মতো অনলাইন প্ল্যাটফর্ম থেকে মোট 500 জনের জন্য 250 জন অংশগ্রহণকারীর সাথে দুটি স্বাধীন পরীক্ষা ডিজাইন করেছে। অংশগ্রহণকারীরা বিভিন্ন বয়স, লিঙ্গ এবং শিক্ষার স্তরের ছিল যাতে একটি বৈচিত্র্যময় নমুনা নিশ্চিত করা যায়।
![]() |
চারটি সাধারণ এআই সিস্টেমের তুলনামূলক সারণী। সূত্র: এআইবেস |
পরীক্ষাটি ঐতিহ্যবাহী টুরিং ফর্ম্যাট ব্যবহার করে: প্রতিটি অংশগ্রহণকারী দুটি বিষয়ের (একজন মানুষ, একজন এআই) সাথে একটি টেক্সট ইন্টারফেসের মাধ্যমে ৫ মিনিট ধরে চ্যাট করে, তারপর কোনটি মানুষ তা মূল্যায়ন করে।
ফলাফলগুলি আশ্চর্যজনক ছিল: GPT-4.5 "টুরিং পরীক্ষায় পাস" করার হার ৭৩% পর্যন্ত অর্জন করেছে, যা মানুষের গড় (৬০-৭০%) ছাড়িয়ে গেছে। এটিই প্রথমবার যখন কোনও AI মডেল স্ট্যান্ডার্ড টুরিং পরীক্ষায় "পাস" করেছে। ইতিমধ্যে, GPT-4o কিছুটা কম স্কোর করেছে, LLaMa-3.1-405B কিছু প্রসঙ্গে মানুষের পারফরম্যান্সের কাছাকাছি পৌঁছেছে বা পৌঁছেছে, এবং ELIZA অনেক পিছিয়ে পড়েছে।
মানুষের মতো মিথস্ক্রিয়া করার ক্ষমতা
GPT-4.5 সম্পর্কে যা স্পষ্ট ছিল তা কেবল ভাষার সাবলীলতাই নয়, বরং আবেগ প্রকাশ করার এবং কথোপকথনের সূক্ষ্মতার সাথে এর প্রতিক্রিয়াগুলিকে খাপ খাইয়ে নেওয়ার ক্ষমতাও ছিল। অনেক অংশগ্রহণকারী এটিকে "বন্ধুত্বপূর্ণ" এবং "খাঁটি" বলে বর্ণনা করেছেন।
উল্লেখযোগ্যভাবে, যখন ব্যবহারকারীরা বিভ্রান্ত বা চাপে থাকতেন, তখন GPT-4.5 হাস্যকর বা সান্ত্বনাদায়ক প্রতিক্রিয়া দিতে পারত, যার ফলে অনেকেই বিশ্বাস করতেন যে তারা একজন প্রকৃত ব্যক্তির সাথে চ্যাট করছেন।
![]() |
পরীক্ষার সময় দুটি বিষয়ের (একজন কৃত্রিম বুদ্ধিমত্তা, একজন মানুষ) মধ্যে কথোপকথন। ছবি: ইউসি সান দিয়েগো । |
এদিকে, LLaMa-3.1-405B, যদিও টেকনিক্যালি চিত্তাকর্ষক, GPT-4.5 এর তুলনায় কম অভিব্যক্তিপূর্ণ এবং কম প্রাসঙ্গিকভাবে অভিযোজিত। GPT-4o, যদিও শক্তিশালী, ব্যক্তিগতকরণ এবং পরিস্থিতিগত প্রতিক্রিয়া অভিযোজনের দিক থেকে নিম্নমানের।
GPT-4.5 এর সাফল্য ভার্চুয়াল টিউটর থেকে শুরু করে মনস্তাত্ত্বিক সহায়তা এবং গ্রাহক সেবা পর্যন্ত বিভিন্ন ব্যবহারিক প্রয়োগের দ্বার উন্মোচন করতে পারে। তবে, AI যত বেশি মানুষের মতো হয়ে উঠবে, বাস্তবতা এবং ভার্চুয়ালতার মধ্যে পার্থক্য করা এবং এই প্রযুক্তি কীভাবে ব্যবহার করা হবে তা নিয়ন্ত্রণ করা একটি গুরুত্বপূর্ণ সামাজিক চ্যালেঞ্জ হয়ে উঠবে।
এআই-এর দ্রুত অগ্রগতির মধ্যে এই গবেষণাটি করা হয়েছে। জিপিটি-৪.৫-এর সাফল্য কেবল ওপেনএআই-এর জন্য একটি প্রযুক্তিগত সাফল্যই নয়, বরং মানুষ এবং মেশিনের মধ্যে সম্পর্ক সম্পর্কেও গভীর প্রশ্ন উত্থাপন করে। একজন পরীক্ষক মন্তব্য করেছিলেন যে মনে হচ্ছিল তিনি একজন বন্ধুর সাথে কথা বলছেন - যতক্ষণ না তিনি বুঝতে পেরেছিলেন যে এটি কেবল কোডের লাইন। মানুষ এবং এআই-এর মধ্যে সংলাপ হয়তো সবেমাত্র শুরু হয়েছে।
সূত্র: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
মন্তব্য (0)