নতুন তিন এআই মডেল

দ্রুত বদলে যাচ্ছে কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি। প্রতি আপডেটেই যোগ হচ্ছে নতুন সব যুগান্তকারী ফিচার। বছরের শেষ প্রান্তিকে বাজারে এসেছে জনপ্রিয় তিন এআইয়ে নতুন তিন মডেল। প্রতিটি প্রতিষ্ঠানেরই লক্ষ্য ছিল এজেন্টিক এআই তৈরি।
২০২৬ সাল হতে যাচ্ছে এজেন্টিক এআইয়ের বছর। প্রতিটি প্রতিষ্ঠান আপ্রাণ চেষ্টা করছে গ্রাহক ধরার। তাই জেমিনি ৩, ক্লড সনেট ৪.৫ এবং জিপিটি ৫.১ তৈরিতে প্রতিটি নির্মাতা প্রতিষ্ঠানের মূল লক্ষ্যবস্তু ছিল এজেন্টিক ফিচার। 

 

জেমিনি ৩

শুরু থেকে জেমিনির প্রতিটি সংস্করণের নামে ব্যবহৃত হতো দশমিক।

১৯ নভেম্বর জেমিনি ৩ প্রকাশিত হওয়ার মাধ্যমে সেটি বাদ দিয়েছে গুগল। নতুন মডেল তৈরিতে গুগলের লক্ষ্য ছিল দীর্ঘ প্রম্পটিংয়ের প্রয়োজনীয়তা যতটা সম্ভব কমানো। গুগলের দাবি, ব্যবহারকারী কী জানতে চাইছে, সেটির পাশাপাশি প্রশ্নটি কেন করেছে—সেটিও বুঝতে সক্ষম জেমিনি ৩। ব্যবহারকারীদের আর প্রম্পটের মধ্যে দীর্ঘ ফিরিস্তি দিতে হবে না।
কথোপকথনের মধ্যে থাকা সুক্ষ্ম বিষয়গুলো সহজেই ধরে ফেলতে সক্ষম। জেমিনি ৩-এর উত্তরগুলো অনেকটাই মানবিক, বন্ধু বা কাজের সঙ্গীর সঙ্গে কথোপকথন চালানোর মতো। পাশাপাশি প্রশ্নের উত্তরগুলোর সঙ্গে সেসব উত্তরের পেছনের কথা এবং প্রয়োজনীয় অন্যান্য তথ্যও তুলে ধরবে। যেমন—‘ঢাকার আশপাশে কোথায় বেড়ানো যায়?’ প্রশ্নের উত্তরে শুধু জনপ্রিয় জায়গার তালিকা না দিয়ে বরং ব্যবহারকারীর পছন্দ-অপছন্দ, আবহাওয়া ও যাতায়াতের সুবিধা আমলে নিয়ে তবেই বেড়ানোর জায়গা রি-কমেন্ড করবে জেমিনি। লেখার পাশাপাশি ছবি, ম্যাপ ও ভিডিও থাকবে উত্তরের মধ্যে।
এমনকি বেড়ানোর স্থানে যাওয়ার জন্য টিকিট কাটা বা হোটেল বুকিং ওয়েবসাইটের ক্ষুদ্র উইজেটও সরাসরি জেমিনি অ্যাপের মধ্যেই পাওয়া যাবে। ছবি, ভিডিও বা অডিও রেকর্ডিং নিয়েও কাজ করতে পারবে জেমিনি ৩। যেমন—ব্যবহারকারীর সাইকেল চালনা শেখার ভিডিও দেখে জেমিনি বলে দিতে পারবে কোথায় ভুল হচ্ছে। 

এজেন্টিক ফিচারও যোগ করেছে গুগল। ‘কক্সবাজার বেড়াতে যাব, থ্রি স্টার হোটেল বুক করো’ প্রম্পট দিলেই বাকি কাজ করবে জেমিনি। একাধিক ধাপে কাজ করতেও পারদর্শী এটি। প্রতিষ্ঠানের যেসব একঘেয়ে কাজের জন্য এত দিন কর্মীর দরকার হতো, সেসব রুটিন কাজ জেমিনি করতে সক্ষম। ভাইব কোডিংয়ের জন্যও বড় ফিচার আপডেট আনা হয়েছে। অ্যাপ বা ওয়েবসাইটের চেহারা কেমন হবে এবং সেটি কী কাজ করবে—তা বুঝিয়ে দিলেই পূর্ণাঙ্গ সফটওয়্যার বা ওয়েবসইট তৈরি করে দেবে জেমিনি।

মোট তিনটি নতুন মডেল এনেছে গুগল—জেমিনি ৩, ৩ প্রো এবং ৩ ডিপ থিংক। জেমিনি ৩ ফ্ল্যাশ এখনো বাজারে আসেনি, আগামী বছর প্রকাশিত হওয়ার সম্ভাবনা আছে। ডিপ থিংক সবচেয়ে গোছানো উত্তর দিতে সক্ষম হলেও উত্তর পেতে অপেক্ষা করতে হয় অনেকটা সময়। তাই বেশির ভাগ ব্যবহারকারীর জন্য জেমিনি ৩ ফাস্ট এখন সেরা মডেল।

 

ক্লড সনেট ৪.৫

অ্যানথ্রোপিকের এআই সেবা ক্লড মোট তিনটি এআই মডেল ব্যবহার করে। এর মধ্যে আছে সনেট ৪.৫, হাইকু ৪.৫ এবং ওপুস ৪.১। ব্যবহারকারীরা সবচেয়ে বেশি সনেট ৪.৫ ব্যবহার করে থাকে। এটি প্রকাশিত হয়েছে ৩০ সেপ্টেম্বর। সবচেয়ে বেশি ফোকাস করা হয়েছে কোড লেখায় পারদর্শিতার ওপর। সফটওয়্যার ইঞ্জিনিয়ারিং বেঞ্চমার্কের বেশ কিছু পরীক্ষার ফলাফল অনুযায়ী ৭৭.২ শতাংশ নির্ভুল কোড লিখতে সক্ষম সনেট ৪.৫। এআই মডেলগুলোর মধ্যে প্রোগ্রামিং পারদর্শিতায় এটিই সবচেয়ে এগিয়ে।

নতুন ফিচারের বদলে অ্যানথ্রোপিকের মূল লক্ষ্য ছিল মডেলের নির্ভরযোগ্যতা বাড়ানো। সনেট ৪.৫ একটানা ৩০ ঘণ্টা পর্যন্ত জটিল বিষয়বস্তু নিয়ে চিন্তাও করতে পারে। তবে মানবিক উত্তরের দিকে তেমন জোর দেওয়া হয়নি, বরং ক্লডের মূল দায়িত্ব এআই এজেন্ট হিসেবে কাজ করা।

১৫ অক্টোবর বাজারে এসেছে হাইকু ৪.৫। একাধিক কাজ করার এজেন্ট হিসেবে কাজ করতে সক্ষম এটি, উত্তরও দেয় সনেট মডেলের তুলনায় দ্রুত। কাস্টমার সার্ভিস বা অন্যান্য কাজের এজেন্ট হিসেবে কাজ করার জন্যই এটি তৈরি করা হয়েছে।

বড় ডেটাবেইসের তথ্য প্রসেসিং এবং দীর্ঘ সময় ধরে কোড লেখার মডেল ওপুস ৪.১। ব্যবহারকারীদের জন্য প্রথম উন্মোচিত হয়েছে ৫ আগস্ট।  অ্যানথ্রোপিকের দাবি, প্রায় ৯৯ শতাংশ ক্ষেত্রে নিরাপদ উত্তর দিতে সক্ষম ওপুস, তাই এটিকে বলা যায় বিশ্বের সবচেয়ে নিরাপদ এআই মডেল।

প্রোগ্রামিংয়ের জন্য এখন বেশির ভাগ সফটওয়্যার নির্মাতার প্রথম পছন্দ ক্লড। সামনে হাইকু বা ওপুসভিত্তিক এআই এজেন্টের প্রসারও দেখা যাবে বলে আশা করছে অ্যানথ্রোপিক।

 

জিপিটি ৫.১

গত ৭ আগস্ট জিপিটি ৫ উন্মোচনের পরপরই ব্যবহারকারীদের তোপের মুখে পড়ে ওপেনএআই। আগের মডেল ৪ও-এর তুলনায় রোবটিক ভাষা ব্যবহার, উত্তরের মধ্যে স্পর্শকাতর বিষয়বস্তু থাকলে সেটি একেবারে এড়িয়ে যাওয়ার প্রবণতা এবং ভুল উত্তর বা ‘হ্যালুসিনেশনের’ মাত্রা বেড়ে যাওয়ায় আবারও ৪ও মডেলটি কিছু সময়ের জন্য ফিরিয়ে আনতে বাধ্য হয় তারা। সেসব সমস্যা কাটিয়ে ওপেনএআই তৈরি করেছে নতুন মডেল জিপিটি ৫.১। এটি উন্মোচিত হয়েছে ১৩ নভেম্বর। প্রথমবারের মতো এআই মডেলটিকে দুটি সংস্করণে ভাগ করা হয়েছে, দ্রুত উত্তর দেওয়ার জন্য ইনস্ট্যান্ট এবং যুক্তিতর্ক দিয়ে উত্তর দেওয়ার জন্য থিংকিং। ফিরিয়ে আনা হয়েছে বেশ কিছু মানবিক গুণাবলি, চ্যাটজিপিটি আবারও আবেগজড়িত ‘ওয়ার্ম’ উত্তর দিতে সক্ষম। এর পাশাপাশি যোগ করা হয়েছে আট ধরনের ব্যক্তিত্ব, প্রয়োজন অনুযায়ী ব্যক্তিত্বের ধরন কাস্টমাইজও করতে পারবে ব্যবহারকারীরা।  ওপেনএআইয়ের দাবি, হ্যালুসিনেশনের পরিমাণ অনেকটাই কমানো হয়েছে। তবে এ নিয়ে কোনো নিরপেক্ষ পরীক্ষা-নিরীক্ষার তথ্য নেই।

জিপিটি ৫.১-এর কনটেক্সট উইন্ডো এখন চার লাখ টোকেনেরও বেশি। অর্থাৎ দীর্ঘ সময় ধরে কথোপকথন চালানো বা জটিল বিষয় নিয়ে চিন্তা-ভাবনা করতে পারবে চ্যাটজিপিটি। প্রোগ্রামিংয়ের জন্যও বড় কনটেক্সট উইন্ডো বেশ কাজের। জিপিটি ৫.১ কোডেক্স ম্যাক্স মডেলটি এজেন্টিক এআই তৈরির জন্য বিশেষভাবে তৈরি করা হয়েছে। এটি একসঙ্গে কয়েক ধরনের জটিল কাজ করতে সক্ষম। অর্থাৎ ‘আমার পছন্দ অনুয়ায়ী হোটেল খুঁজে বুকিংয়ের পর অফিসে ছুটির জন্য আবেদন করে, তারপর আমার অ্যাকাউন্ট থেকে মানানসই কাপড়-চোপড় অর্ডার করে দাও’-এর মতো একাধিক ধাপের কাজ করতে সক্ষম এটি। ব্যক্তিগত সহকারী নয় বরং অফিসকর্মী হওয়ার জন্যই এটি তৈরি করা হয়েছে।

এখনই সব ব্যবহারকারী জিপিটি ৫.১ পাবে না, আপাতত শুধু প্লাস বা প্রো সাবস্ক্রাইবারদের জন্যই এটি উন্মোচন করা হয়েছে। আগামী তিন মাসের মধ্যে ধীরে ধীরে সব ব্যবহারকারীর হাতেই এটি পৌঁছে যাবে। তবে ফ্রি ব্যবহারকারীরা কখনোই সব ফিচার পাবে না।