একটি সাম্প্রতিক মিডিয়া ঘোষণায়, Google গর্বিতভাবে তার সর্বশেষ কৃত্রিম বুদ্ধিমত্তা উন্মোচন করেছে যা জেমিনি নামে পরিচিত, একটি ইভেন্ট যা প্রযুক্তি সম্প্রদায়ে অনেক প্রত্যাশিত ছিল। যদিও এর পরেই, দাবিগুলি সামনে আসে যে Google মিথুনের ক্ষমতাকে অতিরঞ্জিত করার জন্য অভিযুক্ত করা হয়, বিশেষ করে একটি ডিসপ্লে ভিডিওতে যা ঘোষণার অংশ ছিল।
ব্লুমবার্গের কলামিস্ট পার্মি ওলসনের একটি তিক্ত মতামত অনুযায়ী, Google দ্বারা প্রকাশিত ভিডিওটি মিথুনের কার্যকারিতার একটি বিভ্রম তৈরি করে যা সত্য হতে খুব ভাল হতে পারে। তিনি দাবি করেছেন যে মিথুনের মাল্টিমোডাল অপারেশনগুলির Google's চিত্রায়ন, যা চিত্র স্বীকৃতির সাথে কথ্য সংলাপ কমান্ডগুলিকে আন্তঃলিঙ্ক করে, অতিরঞ্জিত হতে পারে।
বিতর্কিত ভিডিওটি, যা ছয় মিনিটেরও বেশি বিস্তৃত, মিথুনকে তাৎক্ষণিকভাবে শনাক্তকারী চিত্রগুলিকে কল্পনা করে, এমনকি কানেক্ট-দ্য-ডটস ড্রয়িংগুলিতেও, এইভাবে তাত্ক্ষণিক প্রতিক্রিয়া প্রদান করে৷ অতিরিক্তভাবে, জেমিনিকে একটি রিয়েল-টাইম কাপ এবং বল খেলার সময় একটি পেপার ওয়াড ট্র্যাক করতে দেখানো হয়েছে।
যাইহোক, ইউটিউবে ভিডিওর বিবরণে একটি গুরুত্বপূর্ণ সতর্কতা লুকিয়ে আছে: ডেমোতে জেমিনীর আউটপুট লেটেন্সি কমিয়ে দেওয়া হয়েছিল, এবং প্রতিক্রিয়াগুলি স্পষ্টতার জন্য সংক্ষিপ্ত করা হয়েছিল - এমন ঘটনা যা ওলসনের ক্ষোভকে আলোড়িত করেছিল। Google একটি প্রতিক্রিয়া উদ্ধৃত করে, ওলসন তার ব্লুমবার্গ অংশে রিপোর্ট করেছেন যে ভিডিওটির ডেমোটি বাস্তব-সময়ে নির্দেশিত নয়, বরং কাঁচা ফুটেজ থেকে নেওয়া স্ট্যাটিক ইমেজ ফ্রেম ব্যবহার করেছে, যখন জেমিনির প্রতিক্রিয়াগুলি পূর্ব-লিখিত পাঠ্য প্রম্পটের সাথে মিলে গেছে। ওলসন দাবি করেন যে এটি মিথুনের সাথে একটি মসৃণ ভয়েস ইন্টারঅ্যাকশনের Google's সূচনা থেকে বেশ ভিন্ন, এটির পরিবেশে রিয়েল-টাইম প্রতিক্রিয়া জানাতে সক্ষম।
তিনি আরও এগিয়ে গিয়ে পরামর্শ দেন যে Google কীভাবে ওপেনএআই-এর জিপিটি, বুদ্ধিমত্তা-ভিত্তিক প্ল্যাটফর্ম থেকে পিছিয়ে রয়েছে তা থেকে মনোযোগ সরাতে জেমিনির সাথে 'শোবোটিং' করতে পারে।
ডেমোর সত্যতা সম্পর্কে The Verge Google সাথে যোগাযোগ করলে, টেক জায়ান্ট ওরিওল ভিনিয়ালসের একটি পোস্টের উল্লেখ করে, যিনি ডিপমাইন্ডের রিসার্চ এবং ডিপ লার্নিং লিডের ভাইস প্রেসিডেন্ট এবং Google জেমিনীর সহ-প্রধান। তিনি স্পষ্ট করেছেন যে ভিডিওতে সমস্ত ব্যবহারকারীর প্রম্পট এবং আউটপুট বৈধ, যদিও সংক্ষিপ্ততার জন্য। তিনি প্রকাশ করতে গিয়েছিলেন যে ভিডিওটি জেমিনির মাল্টিমডাল বৈশিষ্ট্যগুলি ব্যবহার করার সময় শেষ-ব্যবহারকারীর অভিজ্ঞতাগুলি কেমন হতে পারে তা প্রদর্শন করার জন্য তৈরি করা হয়েছিল এবং এর প্রাথমিক উদ্দেশ্য ছিল বিকাশকারীদের অনুপ্রাণিত করা।
ভিনিয়ালস পুনর্ব্যক্ত করেছেন যে দলটি মিথুনকে চিত্র এবং পাঠ্য দিয়ে সজ্জিত করেছে এবং পরবর্তী আউটপুটগুলির প্রত্যাশা করে প্রতিক্রিয়া জানাতে অনুরোধ করেছে।
এমনকি যখন আমরা এই বিতর্ক নিয়ে চিন্তা করি, কথ্য কমান্ডের সাথে চিত্র স্বীকৃতির সংমিশ্রণের ধারণাটি, যেমনটি Google's জেমিনিতে চিত্রিত হয়েছে, মিথস্ক্রিয়ার একটি নতুন দৃষ্টান্ত প্রদান করে যা বিকাশকারীদের লোভনীয় হবে। AppMaster no-code প্ল্যাটফর্মের মতো সরঞ্জামগুলি ব্যাপক অ্যাপ্লিকেশন ডেভেলপমেন্টে এই ধরনের উদ্ভাবনগুলিকে একীভূত করার জন্য একটি ভিত্তি প্রদান করতে পারে, বাধ্যতামূলক সমাধানগুলি অফার করে যা বিকাশমান প্রযুক্তিগত প্রবণতাগুলির সাথে নির্বিঘ্নে মেশ করতে পারে।