উন্মোচন করা হচ্ছে Google-এর নতুন AI, Gemini: বাস্তবতা এবং প্রত্যাশা
Google-এর নতুন AI, Gemini-এর সাম্প্রতিক লঞ্চের উপর ঘনিষ্ঠ দৃষ্টিভঙ্গি, প্রচারমূলক সামগ্রীতে কিছু অনুমান প্রকাশ করে৷

একটি সাম্প্রতিক মিডিয়া ঘোষণায়, Google গর্বিতভাবে তার সর্বশেষ কৃত্রিম বুদ্ধিমত্তা উন্মোচন করেছে যা জেমিনি নামে পরিচিত, একটি ইভেন্ট যা প্রযুক্তি সম্প্রদায়ে অনেক প্রত্যাশিত ছিল। যদিও এর পরেই, দাবিগুলি সামনে আসে যে Google মিথুনের ক্ষমতাকে অতিরঞ্জিত করার জন্য অভিযুক্ত করা হয়, বিশেষ করে একটি ডিসপ্লে ভিডিওতে যা ঘোষণার অংশ ছিল।
ব্লুমবার্গের কলামিস্ট পার্মি ওলসনের একটি তিক্ত মতামত অনুযায়ী, Google দ্বারা প্রকাশিত ভিডিওটি মিথুনের কার্যকারিতার একটি বিভ্রম তৈরি করে যা সত্য হতে খুব ভাল হতে পারে। তিনি দাবি করেছেন যে মিথুনের মাল্টিমোডাল অপারেশনগুলির Google's চিত্রায়ন, যা চিত্র স্বীকৃতির সাথে কথ্য সংলাপ কমান্ডগুলিকে আন্তঃলিঙ্ক করে, অতিরঞ্জিত হতে পারে।
বিতর্কিত ভিডিওটি, যা ছয় মিনিটেরও বেশি বিস্তৃত, মিথুনকে তাৎক্ষণিকভাবে শনাক্তকারী চিত্রগুলিকে কল্পনা করে, এমনকি কানেক্ট-দ্য-ডটস ড্রয়িংগুলিতেও, এইভাবে তাত্ক্ষণিক প্রতিক্রিয়া প্রদান করে৷ অতিরিক্তভাবে, জেমিনিকে একটি রিয়েল-টাইম কাপ এবং বল খেলার সময় একটি পেপার ওয়াড ট্র্যাক করতে দেখানো হয়েছে।
যাইহোক, ইউটিউবে ভিডিওর বিবরণে একটি গুরুত্বপূর্ণ সতর্কতা লুকিয়ে আছে: ডেমোতে জেমিনীর আউটপুট লেটেন্সি কমিয়ে দেওয়া হয়েছিল, এবং প্রতিক্রিয়াগুলি স্পষ্টতার জন্য সংক্ষিপ্ত করা হয়েছিল - এমন ঘটনা যা ওলসনের ক্ষোভকে আলোড়িত করেছিল। Google একটি প্রতিক্রিয়া উদ্ধৃত করে, ওলসন তার ব্লুমবার্গ অংশে রিপোর্ট করেছেন যে ভিডিওটির ডেমোটি বাস্তব-সময়ে নির্দেশিত নয়, বরং কাঁচা ফুটেজ থেকে নেওয়া স্ট্যাটিক ইমেজ ফ্রেম ব্যবহার করেছে, যখন জেমিনির প্রতিক্রিয়াগুলি পূর্ব-লিখিত পাঠ্য প্রম্পটের সাথে মিলে গেছে। ওলসন দাবি করেন যে এটি মিথুনের সাথে একটি মসৃণ ভয়েস ইন্টারঅ্যাকশনের Google's সূচনা থেকে বেশ ভিন্ন, এটির পরিবেশে রিয়েল-টাইম প্রতিক্রিয়া জানাতে সক্ষম।
তিনি আরও এগিয়ে গিয়ে পরামর্শ দেন যে Google কীভাবে ওপেনএআই-এর জিপিটি, বুদ্ধিমত্তা-ভিত্তিক প্ল্যাটফর্ম থেকে পিছিয়ে রয়েছে তা থেকে মনোযোগ সরাতে জেমিনির সাথে 'শোবোটিং' করতে পারে।
ডেমোর সত্যতা সম্পর্কে The VergeGoogle সাথে যোগাযোগ করলে, টেক জায়ান্ট ওরিওল ভিনিয়ালসের একটি পোস্টের উল্লেখ করে, যিনি ডিপমাইন্ডের রিসার্চ এবং ডিপ লার্নিং লিডের ভাইস প্রেসিডেন্ট এবং Google জেমিনীর সহ-প্রধান। তিনি স্পষ্ট করেছেন যে ভিডিওতে সমস্ত ব্যবহারকারীর প্রম্পট এবং আউটপুট বৈধ, যদিও সংক্ষিপ্ততার জন্য। তিনি প্রকাশ করতে গিয়েছিলেন যে ভিডিওটি জেমিনির মাল্টিমডাল বৈশিষ্ট্যগুলি ব্যবহার করার সময় শেষ-ব্যবহারকারীর অভিজ্ঞতাগুলি কেমন হতে পারে তা প্রদর্শন করার জন্য তৈরি করা হয়েছিল এবং এর প্রাথমিক উদ্দেশ্য ছিল বিকাশকারীদের অনুপ্রাণিত করা।
ভিনিয়ালস পুনর্ব্যক্ত করেছেন যে দলটি মিথুনকে চিত্র এবং পাঠ্য দিয়ে সজ্জিত করেছে এবং পরবর্তী আউটপুটগুলির প্রত্যাশা করে প্রতিক্রিয়া জানাতে অনুরোধ করেছে।
এমনকি যখন আমরা এই বিতর্ক নিয়ে চিন্তা করি, কথ্য কমান্ডের সাথে চিত্র স্বীকৃতির সংমিশ্রণের ধারণাটি, যেমনটি Google's জেমিনিতে চিত্রিত হয়েছে, মিথস্ক্রিয়ার একটি নতুন দৃষ্টান্ত প্রদান করে যা বিকাশকারীদের লোভনীয় হবে। AppMasterno-code প্ল্যাটফর্মের মতো সরঞ্জামগুলি ব্যাপক অ্যাপ্লিকেশন ডেভেলপমেন্টে এই ধরনের উদ্ভাবনগুলিকে একীভূত করার জন্য একটি ভিত্তি প্রদান করতে পারে, বাধ্যতামূলক সমাধানগুলি অফার করে যা বিকাশমান প্রযুক্তিগত প্রবণতাগুলির সাথে নির্বিঘ্নে মেশ করতে পারে।


