গুগলের ইতিহাসে প্রতিষ্ঠাটির সবচেয়ে ইনোভেটিভ এবং ক্রিয়েটিভ পরিবর্তন ছিল ২০১৯ সালে। ওই বছরের ২৫ অক্টোবর নতুন একটি অ্যালগরিদম চালু হয়েছে বলে ঘোষণা করে এই প্রযুক্তি জায়ান্ট, যার নাম দেয়া হয় ‘বার্ট অ্যালগরিদম’ (BERT)। এর পূর্ণাঙ্গ রূপ- Bidirectional Encoder Representations from Transformers। এটি মূলত Artificial Intelligence (AI), Machine Learning এবং Natural Language Processing (NLP)-এর মতো জটিল বিষয়ের সমন্বয়ে তৈরি।
বার্টের সবচেয়ে বড় গুন- সে মানুষের মতো করে শব্দ ও বাক্য পড়তে পারে, বুঝতে পারে। অর্থাৎ, বাক্যের ভেতরে থাকা প্রতিটি শব্দের কনটেক্সট বা প্রেক্ষাপট বুঝতে পারে। বার্টের দুটি গুরুত্বপূর্ণ বৈশিষ্ট্য হচ্ছে- এটা Bidirectional এবং Transformer-Based। Bidirectional মানে, শব্দের দুই দিক। অর্থাৎ, শব্দের আগের ও পরের শব্দ বার্ট অ্যানালাইসিস করতে পারে এবং নির্দিষ্ট শব্দের আগে পরে কী শব্দ বসবে- তাও সে ধারণা করতে পারে। আর Transformer মানে হচ্ছে, বার্ট বাক্যের ভেতরে থাকা শব্দগুলোর মধ্যে সংযোগ স্থাপন করতে পারে ও একটা বাক্যের মিনিং দাঁড় করাতে পারে, যেটা আগে গুগলের পক্ষে সম্ভব ছিল না। এক্ষেত্রে বার্ট গুগলের নিজস্ব ভাণ্ডারের ৮০০ মিলিয়ন শব্দ ও উইকিপিডিয়ার ২৫০০ মিলিয়ন শব্দ ব্যবহার করছে।
বার্টের আরও দুটি বৈশিষ্ট্য: এটা Pre-Trained এবং Unsupervised। Pre-Trained মানে হচ্ছে, বার্টকে আগে থেকেই সব শিখিয়ে পড়িয়ে নেয়া হয়েছে। আর Unsupervised মানে, সে নিজে থেকেই অনেক কাজ করতে পারে। প্রতিটি ক্ষেত্রে আলাদা করে দিক নির্দেশনা দেয়ার প্রয়োজন হয় না।
ডিজিটাল মার্কেটারদের জন্য এটা জেনে রাখা এজন্য প্রয়োজন যে যারা কন্টেন্ট নিয়ে কাজ করেন, তাদের কাজে বার্টের প্রভাব থাকবে। কারণ গুগল তার ব্লগে বলে দিয়েছে- মোট সার্চের ১০ শতাংশ সার্চে বার্ট প্রভাব ফেলছে। নতুন এই অ্যালগরিদম সব ধরনের বাক্য নিয়ে কাজ করে না। যেসব বাক্যে স্টপ ওয়ার্ড আছে, সেসব বাক্যই মূলত বার্টের টার্গেট। স্টপ ওয়ার্ড বলতে বিভিন্ন Preposition-কে বোঝানো হচ্ছে। আগে গুগল বাক্যের ভেতরে থাকা to, in, from, on এ ধরনের শব্দের অর্থ বুঝতে পারতো না। তবে এখন আর এগুলো অর্থ বুঝতে গুগলের কোনও সমস্যা হচ্ছে না। তাছাড়া গুগল প্রতিদিন ১৫ শতাংশ নতুন সার্চ পাচ্ছে, যেগুলো আগে কখনো দেখা যায়নি। এই নতুন সার্চগুলোও বার্ট তার সিস্টেমে স্বয়ংক্রিয়ভাবে অপটিমাইজ করতে পারছে।
বার্ট নিয়ে ডিজিটাল মার্কেটার কী করার আছে? আসলে কিছুই করার নেই। কন্টেন্ট নিয়ে যারা কাজ করছেন, তাদের এতটুকু জানা দরকার যে কন্টেন্টকে আগের চেয়ে আরও শক্তিশালী করতে হবে, নির্ভুল করতে হবে- প্রতিটি বাক্য এবং প্রতিটি শব্দ। বাক্যের ক্ষেত্রে প্রতিটি বাক্যের সেন্টিমেন্ট পজিটিভ- কমপক্ষে বেশিরভাগ পজিটিভ ও বাকিগুলো নিউট্রাল রাখা দরকার এবং হাই স্যালিয়েন্স স্কোরের সিমান্টিক ওয়ার্ড কন্টেন্টে প্রচুর ব্যবহার করতে হবে।
আরেকটা ব্যাপার- বার্ট এমন অ্যালগরিদম নয়, যেটা শুধু গুগলই ব্যবহার করবে। এটা একটা ওপেন-সোর্স টেকনোলজি। যদিও গুগলের লোকেরাই এটা তৈরি করেছে। তবে যে কেউ চাইলে এটা তার কাজে ব্যবহার করতে পারবে। সামনের দিনগুলোতে সম্ভবত কৃত্রিম বুদ্ধিমত্তা- বিশেষ করে রোবটিকসে আমরা এর প্রচুর কাজ দেখতে পাবো।
সার্চ অ্যালগরিদমে বার্টই কি শেষ কথা? না। গুগল নিজেই বলছে যে বার্টের দুর্বলতা আছে। এমন কিছু সার্চ টার্ম আছে, যেগুলোর অর্থ বার্ট এখনও বুঝতে পারে না। যেমন ‘what state is south of Nebraska’ লিখে সার্চ দিলে বার্ট এখানে South Nebraska নামের একটা অঞ্চলকে বোঝাচ্ছে। তাই সারাজীবনই এর উন্নততর সংস্করণ নিয়ে কাজ চলতে থাকবে। সম্প্রতি আরও নতুন একটি অ্যালগরিদম আপডেটের কথা শোনা যাচ্ছে। সেটা নিয়ে আরেকদিন লিখবো ইনশাআল্লাহ।আর্টিকেলের মূল লেখকঃ Rashed Ahmed Shaon
Leave a Reply