০৮ ডিসে, ২০২৩·1 মিনিট পড়তে

উন্মোচন করা হচ্ছে Google-এর নতুন AI, Gemini: বাস্তবতা এবং প্রত্যাশা

Google-এর নতুন AI, Gemini-এর সাম্প্রতিক লঞ্চের উপর ঘনিষ্ঠ দৃষ্টিভঙ্গি, প্রচারমূলক সামগ্রীতে কিছু অনুমান প্রকাশ করে৷

উন্মোচন করা হচ্ছে Google-এর নতুন AI, Gemini: বাস্তবতা এবং প্রত্যাশা

একটি সাম্প্রতিক মিডিয়া ঘোষণায়, Google গর্বিতভাবে তার সর্বশেষ কৃত্রিম বুদ্ধিমত্তা উন্মোচন করেছে যা জেমিনি নামে পরিচিত, একটি ইভেন্ট যা প্রযুক্তি সম্প্রদায়ে অনেক প্রত্যাশিত ছিল। যদিও এর পরেই, দাবিগুলি সামনে আসে যে Google মিথুনের ক্ষমতাকে অতিরঞ্জিত করার জন্য অভিযুক্ত করা হয়, বিশেষ করে একটি ডিসপ্লে ভিডিওতে যা ঘোষণার অংশ ছিল।

ব্লুমবার্গের কলামিস্ট পার্মি ওলসনের একটি তিক্ত মতামত অনুযায়ী, Google দ্বারা প্রকাশিত ভিডিওটি মিথুনের কার্যকারিতার একটি বিভ্রম তৈরি করে যা সত্য হতে খুব ভাল হতে পারে। তিনি দাবি করেছেন যে মিথুনের মাল্টিমোডাল অপারেশনগুলির Google's চিত্রায়ন, যা চিত্র স্বীকৃতির সাথে কথ্য সংলাপ কমান্ডগুলিকে আন্তঃলিঙ্ক করে, অতিরঞ্জিত হতে পারে।

বিতর্কিত ভিডিওটি, যা ছয় মিনিটেরও বেশি বিস্তৃত, মিথুনকে তাৎক্ষণিকভাবে শনাক্তকারী চিত্রগুলিকে কল্পনা করে, এমনকি কানেক্ট-দ্য-ডটস ড্রয়িংগুলিতেও, এইভাবে তাত্ক্ষণিক প্রতিক্রিয়া প্রদান করে৷ অতিরিক্তভাবে, জেমিনিকে একটি রিয়েল-টাইম কাপ এবং বল খেলার সময় একটি পেপার ওয়াড ট্র্যাক করতে দেখানো হয়েছে।

যাইহোক, ইউটিউবে ভিডিওর বিবরণে একটি গুরুত্বপূর্ণ সতর্কতা লুকিয়ে আছে: ডেমোতে জেমিনীর আউটপুট লেটেন্সি কমিয়ে দেওয়া হয়েছিল, এবং প্রতিক্রিয়াগুলি স্পষ্টতার জন্য সংক্ষিপ্ত করা হয়েছিল - এমন ঘটনা যা ওলসনের ক্ষোভকে আলোড়িত করেছিল। Google একটি প্রতিক্রিয়া উদ্ধৃত করে, ওলসন তার ব্লুমবার্গ অংশে রিপোর্ট করেছেন যে ভিডিওটির ডেমোটি বাস্তব-সময়ে নির্দেশিত নয়, বরং কাঁচা ফুটেজ থেকে নেওয়া স্ট্যাটিক ইমেজ ফ্রেম ব্যবহার করেছে, যখন জেমিনির প্রতিক্রিয়াগুলি পূর্ব-লিখিত পাঠ্য প্রম্পটের সাথে মিলে গেছে। ওলসন দাবি করেন যে এটি মিথুনের সাথে একটি মসৃণ ভয়েস ইন্টারঅ্যাকশনের Google's সূচনা থেকে বেশ ভিন্ন, এটির পরিবেশে রিয়েল-টাইম প্রতিক্রিয়া জানাতে সক্ষম।

তিনি আরও এগিয়ে গিয়ে পরামর্শ দেন যে Google কীভাবে ওপেনএআই-এর জিপিটি, বুদ্ধিমত্তা-ভিত্তিক প্ল্যাটফর্ম থেকে পিছিয়ে রয়েছে তা থেকে মনোযোগ সরাতে জেমিনির সাথে 'শোবোটিং' করতে পারে।

ডেমোর সত্যতা সম্পর্কে The VergeGoogle সাথে যোগাযোগ করলে, টেক জায়ান্ট ওরিওল ভিনিয়ালসের একটি পোস্টের উল্লেখ করে, যিনি ডিপমাইন্ডের রিসার্চ এবং ডিপ লার্নিং লিডের ভাইস প্রেসিডেন্ট এবং Google জেমিনীর সহ-প্রধান। তিনি স্পষ্ট করেছেন যে ভিডিওতে সমস্ত ব্যবহারকারীর প্রম্পট এবং আউটপুট বৈধ, যদিও সংক্ষিপ্ততার জন্য। তিনি প্রকাশ করতে গিয়েছিলেন যে ভিডিওটি জেমিনির মাল্টিমডাল বৈশিষ্ট্যগুলি ব্যবহার করার সময় শেষ-ব্যবহারকারীর অভিজ্ঞতাগুলি কেমন হতে পারে তা প্রদর্শন করার জন্য তৈরি করা হয়েছিল এবং এর প্রাথমিক উদ্দেশ্য ছিল বিকাশকারীদের অনুপ্রাণিত করা।

ভিনিয়ালস পুনর্ব্যক্ত করেছেন যে দলটি মিথুনকে চিত্র এবং পাঠ্য দিয়ে সজ্জিত করেছে এবং পরবর্তী আউটপুটগুলির প্রত্যাশা করে প্রতিক্রিয়া জানাতে অনুরোধ করেছে।

এমনকি যখন আমরা এই বিতর্ক নিয়ে চিন্তা করি, কথ্য কমান্ডের সাথে চিত্র স্বীকৃতির সংমিশ্রণের ধারণাটি, যেমনটি Google's জেমিনিতে চিত্রিত হয়েছে, মিথস্ক্রিয়ার একটি নতুন দৃষ্টান্ত প্রদান করে যা বিকাশকারীদের লোভনীয় হবে। AppMasterno-code প্ল্যাটফর্মের মতো সরঞ্জামগুলি ব্যাপক অ্যাপ্লিকেশন ডেভেলপমেন্টে এই ধরনের উদ্ভাবনগুলিকে একীভূত করার জন্য একটি ভিত্তি প্রদান করতে পারে, বাধ্যতামূলক সমাধানগুলি অফার করে যা বিকাশমান প্রযুক্তিগত প্রবণতাগুলির সাথে নির্বিঘ্নে মেশ করতে পারে।

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started