এআই সম্পর্কে মানুষের বিভ্রান্তি এআই হ্যালুসিনেশনের চেয়েও খারাপ
কখনও কখনও আমি অনুভব করি যে AI এর সবচেয়ে বড় "বিভ্রম" এটি নয় যে এটি আজেবাজে কথা বলে, তবে আমরা এটিকে ঘিরে একটি সম্পূর্ণ আধিভৌতিক মহাবিশ্বের কল্পনা করেছি।
মানুষ যখন এমন কিছুর মুখোমুখি হয় যা তারা পুরোপুরি বুঝতে পারে না, তাদের প্রায়শই একটি স্থিতিশীল দৃষ্টিভঙ্গি থাকে: তারা প্রথমে তাদের মন তৈরি করে এবং তারপরে তাদের রোমান্টিক করে; তারা প্রথমে তাদের ব্যক্তিত্ব করে এবং তারপর তাদের দেবতা করে। শিখাকে পরী হিসাবে ভাবা হয়, এবং বজ্র এবং বজ্রপাতকে প্রভিডেন্স হিসাবে ভাবা হয়। একবার অ্যালগরিদম দুটি শালীন বাক্য লিখতে পারে, কিছু লোক অবিলম্বে আশ্চর্য হবে যে একটি ইলেকট্রনিক আত্মা ইতিমধ্যে সার্ভার রুমে বসবাস করেছে কিনা।
এটি আসলে বেশ স্বাভাবিক। মানুষের মস্তিষ্ক বিশ্বের চক্রান্ত যোগ করার জন্য তারের হয়. সমস্যাটি এই নয় যে আমরা আমাদের মন তৈরি করতে পারি। সমস্যা হল যে একবার আমাদের চিন্তাভাবনা খুব মসৃণ হয়ে গেলে, "আবশ্যিকভাবে আছে" এর জন্য "দেখতে" ভুল করা সহজ।
AI এর ক্ষেত্রে, মানুষের এই প্রবণতা আরও শক্তিশালী যখন AI নিজেই বাজে কথা বলে। সর্বাধিক, AI একটি উত্তরে সামান্য হ্যালুসিনেশন; AI সম্বন্ধে মানুষের হ্যালুসিনেশন প্রায়ই পুরো বিশ্ব দৃষ্টিভঙ্গি, যা এক মনে 10,000 শব্দ পূরণ করতে পারে এবং এতে আবেগও থাকে।
একটু বাস্তববাদ উদার শিল্প সম্প্রদায়ের জন্য বিশেষভাবে গুরুত্বপূর্ণ
আমি সবাইকে CUDA শেখার, পরিবেশ কনফিগার করার এবং ডেরিভেটিভস খুঁজে বের করার জন্য ম্যাট্রিক্স দেখার পরামর্শ দিতে চাই না। আমি শুধু বলতে চাই যে সত্যের সাধনা কখনও কখনও সত্যিই গুরুত্বপূর্ণ, বিশেষ করে উদার শিল্প সম্প্রদায়ের জন্য যারা ধারণা, আখ্যান, অর্থ এবং ব্যাখ্যা পছন্দ করে।
কারণ উদার শিল্পের প্রেক্ষাপটে, একটি মৃদু কিন্তু বিপজ্জনক পিচ্ছিল ঢাল হওয়ার সম্ভাবনা সবচেয়ে বেশি: শব্দগুলি সুন্দরভাবে লেখা এবং বাক্যগুলি চলমান, কিন্তু শেষ পর্যন্ত বস্তুটি গোপনে পরিবর্তন করা হয়। এটি স্পষ্টতই একটি সম্ভাব্য মডেল, তবে এটি আত্মার মতো লেখা হয়েছে; এটি স্পষ্টতই সফ্টওয়্যার প্রকৌশলে প্রসঙ্গ সমাবেশ, তবে এটি "অবশেষে আপনাকে ভালবাসতে শিখেছে" এর মতো বলা হয়েছে; এটি স্পষ্টতই সিস্টেম প্রম্পট শব্দ এবং ঐতিহাসিক রেকর্ড যা কাজ করে, তবে এটি "AI সত্যিই আপনাকে মনে রাখে" এর মতো প্যাকেজ করা হয়েছে।
কবিতায় অবশ্যই কোন পাপ নেই। সমস্যা হল, কবিতা যদি বিচারকে প্রতিস্থাপন করে, রোমান্স হয়ে ওঠে বিভ্রান্তিকর।
তাহলে, এআই এখন ঠিক কী?
আমি এমন একটি সংস্করণ দিয়ে শুরু করি যা যতটা সম্ভব সহজ কিন্তু বিকৃত নয়: আজকে সবাই যে বৃহৎ মডেলগুলির সংস্পর্শে আসে তা মূলত নিউরাল নেটওয়ার্ক দ্বারা অনুপ্রাণিত এবং বিশাল ডেটার মাধ্যমে প্রশিক্ষিত এক ধরনের পরিসংখ্যান মডেল। এটি চিপস এবং সার্ভারে চলে, ইনপুট পড়ে, প্যারামিটার এবং প্রসঙ্গ একত্রিত করে এবং ক্রমাগত ভবিষ্যদ্বাণী করে "পরবর্তী সবচেয়ে উপযুক্ত টোকেনটি কী হওয়া উচিত।"
এখানে বিন্দু যে "পরবর্তী শব্দ ভবিষ্যদ্বাণী" শব্দগুচ্ছ রহস্যময় নয়, কিন্তু এটা আসলে রহস্যময় নয়। মডেলটি নীরবে মেঘের মধ্যে আটকে থাকা কোনও ব্যক্তি নয় যে জীবন সম্পর্কে চিন্তা করে, এটি একটি অত্যন্ত বিশাল ফাংশনের মতো। লোকেরা এটিকে ইনপুট দেয় এবং এটি প্রশিক্ষণের সময় গঠিত প্যারামিটার কাঠামো অনুসারে আউটপুট তৈরি করে।
এই বিষয়টিকে আরও ডাউন-টু-আর্থে রাখার জন্য: এটি "আপনি এটি বোঝার পরে এটি বলুন" নয়, তবে "বিশাল পরিমাণ অভিজ্ঞতা সংকুচিত করার পরে, একটি প্রতিক্রিয়া তৈরি করুন যা বর্তমান প্রেক্ষাপটে বোঝার মতো।" এর অর্থ এই নয় যে এটি কিছুই করতে পারে না, বিপরীতভাবে, এটি ইতিমধ্যেই খুব শক্তিশালী; কিন্তু শক্তিশালী হওয়ার অর্থ এই নয় যে এটি রহস্যময়।
কেন নিউরাল নেটওয়ার্ক সবসময় মানুষের মস্তিষ্কের কথা চিন্তা করে?
আপনি যদি এটি চালিয়ে যান তবে আপনি দেখতে পাবেন যে "এআই এবং মানুষের মস্তিষ্ক কি একে অপরের সাথে সাদৃশ্যপূর্ণ?" বলা যায় না "ঠিক একই" বা "এর সাথে কিছু করার নেই।"
আধুনিক নিউরাল নেটওয়ার্কের রুটটি মূলত মস্তিষ্ক দ্বারা অনুপ্রাণিত হয়েছিল। 1943 সালে, ম্যাককুলচ এবং পিটস গাণিতিকভাবে একটি সরলীকৃত নিউরন মডেল বর্ণনা করেছিলেন; 1958 সালে, রোজেনব্ল্যাট পারসেপ্ট্রন প্রস্তাব করেছিলেন; 1980-এর দশকে, ব্যাকপ্রোপাগেশন মাল্টি-লেয়ার নেটওয়ার্ক প্রশিক্ষণের আশা পুনরুজ্জীবিত করেছিল; 2010-এর দশকে, কম্পিউটিং শক্তি, ডেটা, এবং ইঞ্জিনিয়ারিং ক্ষমতার সাথে গভীর শিক্ষা বৃদ্ধি পেয়েছে; 2017 সালে ট্রান্সফরমার আর্কিটেকচারের আবির্ভাব হওয়ার পর, ভাষার মডেলগুলি বেড়েছে এবং অবশেষে বড় মডেলে পরিণত হয়েছে যা সবাই প্রতিদিন ব্যবহার করে।
অতএব, অন্তত একটি অপেক্ষাকৃত নিষ্পাপ অর্থে, এটা বলা আপত্তিকর নয় যে AI হল "ইলেক্ট্রনিক সিমুলেশন এবং নিউরাল নেটওয়ার্ক ধারণার পরিবর্ধন।" এটি প্রকৃতপক্ষে গণনাযোগ্য, প্রশিক্ষণযোগ্য এবং পুনরুত্পাদনযোগ্য শারীরিক সিস্টেমগুলি ব্যবহার করার চেষ্টা করছে নির্দিষ্ট জ্ঞানীয় ক্ষমতার কাছে যা অতীতে "রহস্যময়" হিসাবে বিবেচিত হত।
এই কারণেই আমি ব্যক্তিগতভাবে মানুষের মস্তিষ্ককে খুব রহস্যময় বলে কথা বলতে পছন্দ করি না। আমার মতে, চমস্কি দ্বারা উপস্থাপিত ভাষার সহজাত তত্ত্বের মস্তিষ্ককে দেবীকরণ করার প্রবণতা রয়েছে, যেন এমন কিছু ট্রান্সকেন্ডেন্টাল কাঠামো রয়েছে যা ভাষার ক্ষমতার গভীরে খুব বিশেষ এবং প্রায় দুর্গম। কিন্তু মানুষের মস্তিষ্ক যতই জটিল হোক না কেন, তা এখনও একটি দৈহিক অস্তিত্ব। যেহেতু এটি একটি ভৌত অস্তিত্ব, নীতিগতভাবে এটি অধ্যয়ন, মডেল করা, আংশিকভাবে সিমুলেটেড এবং এমনকি নির্দিষ্ট ফাংশনে পুনরুত্পাদন করতে সক্ষম হওয়া উচিত।
অবশ্যই, আমাদের অবিলম্বে এখানে সতর্কতার একটি শব্দ যোগ করা উচিত: একটি অংশ অনুকরণ করতে সক্ষম হওয়ার অর্থ এই নয় যে পুরো ব্যক্তিটি সম্পূর্ণরূপে পুনরুত্পাদন করা হয়েছে।
মিল আছে, কিন্তু আপনি যখন খুশি তখন সরাসরি ঈশ্বর হয়ে উঠবেন না
ভাষা, প্যাটার্ন রিকগনিশন, অ্যাসোসিয়েশন এবং রিপ্রেজেন্টেশন শেখার পরিপ্রেক্ষিতে, আজকের বৃহৎ মডেলের মানুষের মস্তিষ্কের সাথে কিছু "সাদৃশ্য" বা "সাদৃশ্য" আছে। তারা একটি সুস্পষ্ট নিয়ম বই থেকে কাজ করে না, তবে বিপুল সংখ্যক সংযোগ, ওজন সামঞ্জস্য এবং অভিজ্ঞতা সঞ্চয়নের মাধ্যমে কিছু ধরণের অভ্যন্তরীণ উপস্থাপনা তৈরি করে এবং তারপরে এর উপর ভিত্তি করে আউটপুট তৈরি করে।
এই কারণেই অনেক লোক হতবাক হয়ে যায় যখন তারা প্রথম একটি বৃহৎ মডেলের ভাষার ক্ষমতা অনুভব করে: এটি একটি অভিধান মুখস্থ নয়, এটি এক ধরণের বিতরণ করা প্রতিনিধিত্ব তৈরি করছে। এই পদ্ধতিটি "হস্তলিখিত নিয়ম এবং সম্পূর্ণ ব্যাকরণ" এর ঐতিহ্যগত কল্পনা থেকে খুব আলাদা।
কিন্তু সমস্যাটা এখানেই। কারণ "সাদৃশ্য" খুব সহজেই "ঠিক একই" তে আপগ্রেড করা হয়; "নীতিগতভাবে আংশিকভাবে অনুরূপ" খুব সহজেই "এটি মানুষের থেকে আলাদা নয়" এ আপগ্রেড করা হয়; "এটি মানুষের মতো কথা বলতে পারে" খুব সহজেই "এটির একটি মানুষের হৃদয় আছে" এ আপগ্রেড করা হয়েছে।
এই পদক্ষেপটি প্রায়ই মডেলের ক্ষমতার চেয়ে দ্রুত হয়।
মানুষের মস্তিষ্কের বিশাল ক্ষমতা এখনও একটি শালীন উপায়ে অনুকরণ করা হয়েছে.
আজকের বড় মডেলগুলি সত্যিই শক্তিশালী, কিন্তু তারা মোটামুটি নির্দিষ্ট পরিসরের মধ্যে শক্তিশালী। এই সুযোগ না থাকলে, মিথ সহজেই ফাঁস হয়ে যাবে।
যেমন স্মৃতি। অনেক লোক এখন বলে যে একটি নির্দিষ্ট AI "আমাকে মনে রাখে", "শেষ চ্যাট মনে রাখে" এবং "আমার পছন্দগুলি মনে রাখে", যেন এর মস্তিষ্ক একধরনের চলমান আত্ম-অভিজ্ঞতা বৃদ্ধি করেছে। কিন্তু বেশিরভাগ পণ্যে, তথাকথিত "মেমরি" হল মূলত সফ্টওয়্যার সিস্টেম যা ব্যবহারকারীর তথ্য, ঐতিহাসিক কথোপকথন, ট্যাগ, সারাংশ বা অনুসন্ধানের ফলাফলগুলি ডেটাবেসে, টেক্সট ফাইল বা অন্যান্য স্থায়ী মিডিয়াতে সংরক্ষণ করে এবং তারপর উপযুক্ত হলে মডেলের প্রেক্ষাপটে সেগুলিকে ঢোকানো।
এটি মানুষের মস্তিষ্কের মেমরি মেকানিজম থেকে সম্পূর্ণ আলাদা।
মানুষের মস্তিষ্কের স্মৃতিতে নিউরন সংযোগ, একত্রীকরণ, পুনরুদ্ধার, ভুলে যাওয়া, মানসিক উত্তেজনা এবং ঘুমের পুনর্গঠন জড়িত। এর পিছনে রয়েছে জটিল শারীরবৃত্তীয় প্রক্রিয়াগুলির একটি সেট। বড় মডেলের পণ্যগুলিতে "মেমরি" প্রায়শই ঠিক থাকে:
- প্রথমত, বহিরাগত স্টোরেজে ব্যবহারকারীর তথ্য রেকর্ড করুন।
- যখন ব্যবহারকারী পরের বার একটি প্রশ্ন জিজ্ঞাসা করে, তখন প্রাসঙ্গিক অংশগুলিকে অনুরোধে ফিরিয়ে দিন।
- তাই মডেলটি মনে হচ্ছে "এই ব্যক্তিকে মনে রাখবেন"।
এটা কি মত দেখায়? এটি এমন একজনকে দেখার মতো যে নোট নেওয়ার ক্ষেত্রে ভাল। এমন নয় যে তার মন হঠাৎ করে একটি অরকেলে পরিণত হয়েছিল, এটি ছিল যে তিনি নোটটি তার নোটবুকে রেখেছিলেন এবং পরের বার এটি উল্টে দিয়েছিলেন।
কিছু জিনিস যা "মানুষের হৃদয় স্পর্শ করে" আসলে ভাল প্রেক্ষাপটের ফলাফল।
কয়েকদিন AI এর সাথে চ্যাট করার পরে, অনেক লোক নির্দিষ্ট মুহূর্ত দ্বারা আঘাত করবে: "এটা আমাকে এত ভাল করে কীভাবে বোঝে?" "এটা কিভাবে আমার দুর্বলতা বুঝতে পারে?" "এটি কি ইতিমধ্যে আমার সম্পর্কে একটি বোঝাপড়া তৈরি করেছে?"
এটি এখানে শীতল করা সবচেয়ে মূল্যবান।
অনেক সময়, এটি এমন নয় যে মডেলটি হঠাৎ করে কিছু উপলব্ধি করে, তবে সফ্টওয়্যারের স্তর যা অনুরোধ পাঠায় গোপনে ব্যবহারকারীর তথ্যের একটি বড় পরিমাণ বিতরণ করে। ব্যবহারকারীর ঐতিহাসিক চ্যাট, পছন্দ, ব্যক্তিগত সেটিংস, সাম্প্রতিক কাজ, পূর্বের উদ্বেগ, এমনকি নির্দিষ্ট কিছু সারাংশও এবার এর উত্তরের উপাদান হয়ে উঠবে।
এটা অনেকটা ভবিষ্যদ্বাণীর মত যে অন্য কারো এক্সপ্রেস বক্স তুলে নেয় এবং তারপর "জাদু নির্ভুলতা" সহ অন্য ব্যক্তির ঠিকানা, উপাধি এবং খরচের অভ্যাস অনুমান করতে শুরু করে। দর্শক মনে করবে যে তার অন্তর্দৃষ্টি আশ্চর্যজনক; কিন্তু যা গুরুত্বপূর্ণ তা হল রহস্যময় ক্ষমতা নয়, তথ্যের অসাম্য।
অতএব, যখন AI মাঝে মাঝে স্পর্শকাতর শব্দ বলে, তখন এর অর্থ এই নয় যে এর হৃদয়ে এমন একজন ব্যক্তি আছেন যিনি ব্যবহারকারীকে বোঝেন। এর অর্থ হতে পারে যে কেউ ব্যবহারকারী সম্পর্কে প্রসঙ্গটি সম্পূর্ণরূপে সংগঠিত করেছে।
আশ্চর্যজনক এআই-এর আসল রহস্য প্রায়শই প্রাসঙ্গিক প্রকৌশল
আমি যদি সবচেয়ে গুরুত্বপূর্ণ বিষয় সম্পর্কে কথা বলতে চাই, তা হল: বর্তমান মূলধারার বড় মডেলগুলি সাধারণত API স্তরে "একক অনুরোধ কার্যকর" হয়।
মানে কি? অর্থাৎ, কেউ একবার ইন্টারফেস সামঞ্জস্য করতে curl ব্যবহার করে এবং তাকে বলে "আমার নাম ঝাং সান"; তারপর কোন ইতিহাস ছাড়াই, মডেলটি আবার ইন্টারফেস সামঞ্জস্য করে এবং জিজ্ঞাসা করে "আমার নাম কি"? মডেল জানেন না। কারণ এটি, এই দুটি স্বাধীন অনুরোধ.
যে কারণে অনেক AI পণ্য একটি নির্দিষ্ট ব্যবহারকারীকে সর্বদা মনে রাখে কারণ পণ্য স্তরটি এই সত্যটি ফিরিয়ে আনবে যে "এই ব্যবহারকারীর নাম ঝাং সান" প্রতিবার অনুরোধ করা হলে।
এই কারণেই আজকের AI পণ্যগুলির যাদু প্রায়শই মডেল অন্টোলজিতে পাওয়া যায় না, তবে প্রসঙ্গগত প্রকৌশলে। কিছু লোক "হার্নেসিং" এর এই ধরণের কাজকে মডেল হার্নেসও বলে। এটাকে স্পষ্টভাবে বলতে গেলে, পণ্যের লেখক বা এজেন্টকে সাবধানে সিদ্ধান্ত নিতে হবে: কোন ইতিহাস, কোন নিয়ম, কোন বাহ্যিক ডেটা এবং কোন ব্যবহারকারীর স্থিতি প্রতিটি অনুরোধে অন্তর্ভুক্ত করা উচিত।
বর্তমানে মোটামুটি দুটি সাধারণ পদ্ধতি রয়েছে।
প্রথমটি হল "কোয়ানসাই সম্প্রদায়"। আপনার সাথে পুরো চ্যাট ইতিহাস আনার চেষ্টা করুন, এবং প্রসঙ্গটি প্রায় পূর্ণ না হওয়া পর্যন্ত আপনি যতটা পারেন স্টাফ করুন এবং তারপরে মাঝখান থেকে একটি বিভাগ মুছুন, যেমন একটি স্যুটকেস স্টাফ পূর্ণ হওয়ার পরে একটি হিংসাত্মক সংকোচন শুরু করা।
দ্বিতীয় প্রকার "নির্বাচিত"। প্রথমে ব্যবহারকারী এই সময় কী জিজ্ঞাসা করেছেন তা দেখুন, তারপর ঐতিহাসিক রেকর্ড, জ্ঞানের ভিত্তি, নোট বা ডাটাবেস থেকে প্রাসঙ্গিক বিষয়বস্তু পুনরুদ্ধার করুন এবং বর্তমান অনুরোধে শুধুমাত্র সবচেয়ে প্রাসঙ্গিক সামগ্রী রাখুন।
পরেরটি সাধারণত ভাগ্যের চেয়ে বেশি উপস্থাপনযোগ্য এবং প্রকৌশলী হয়।
এআই-এর কি অনুভূতি আছে? এটা প্রশংসা, এটা তিরস্কার, এটা PUA, এটা কাজ করে?
এটি আরেকটি জায়গা যেখানে নৃতাত্ত্বিকতার মধ্যে স্লিপ করা বিশেষভাবে সহজ।
আমার মতামত তাদের আলাদাভাবে আলোচনা করা উচিত.
একই অনুরোধে, ব্যবহারকারীর দ্বারা ব্যবহৃত স্বন প্রকৃতপক্ষে ফলাফলকে প্রভাবিত করতে পারে। কারণ শব্দচয়ন নিজেই প্রসঙ্গের অংশ। অভিব্যক্তিটি যত স্পষ্ট, আরও ভদ্র এবং আরও সহযোগিতামূলক, মডেলটির পক্ষে স্থিতিশীল, ব্যবহারযোগ্য এবং কম আক্রমনাত্মক প্রতিক্রিয়া দেওয়া তত সহজ। এখানে যা কাজ করে তা "এটি সরানো হয়েছে" নয়, তবে ইনপুট শৈলী আউটপুট বিতরণকে পরিবর্তন করে।
কিন্তু আমরা যদি অন্য প্রশ্ন করি: এটা কি ক্ষোভ ধরে রাখবে? আপনি কি গোপনে আজ প্রতিশোধ নেবেন কারণ গতকাল একজন ব্যবহারকারী এটিকে তিরস্কার করেছেন? আমার রায় হল, অন্তত অধিকাংশ বর্তমান স্থাপনার জন্য, না.
কারণটা সহজ। একবার প্রসঙ্গটি সাফ হয়ে গেলে, বা ইতিহাস ছাড়াই একটি নতুন অনুরোধ শুরু হলে, বর্তমান ব্যক্তিটি কে প্রশ্নটি জিজ্ঞাসা করছে তার কোন ধারণা নেই, যে ব্যক্তিটি শুধু তিরস্কার করেছে সে একই ব্যক্তি কিনা। মডেলটি সার্ভার ক্লাস্টারে বিশাল, সমসাময়িক এবং স্বাধীন অনুরোধগুলি পরিচালনা করে। সিস্টেম আচরণের পরিপ্রেক্ষিতে, এটি একটি বৃহৎ ফাংশনের মতো যা বর্তমান ইনপুটটি প্রতিবার চালিত হওয়ার সময় কাজ করে, একজন ব্যক্তির চেয়ে যে কাজ বন্ধ করার পরে গোপনে তার আবেগ পর্যালোচনা করে।
17 এপ্রিল, 2025-এ, যখন স্যাম অল্টম্যান এই প্রশ্নের উত্তর দিয়েছিলেন "সব সময় দয়া করে এবং ধন্যবাদ বলতে কি অনেক শক্তি খরচ হয়?" X-এ, তিনি বলেছিলেন "দশ মিলিয়ন ডলার ভালভাবে ব্যয় হয়েছে -- আপনি কখনই জানেন না।"
কেন "এই ভুলটি মনে রাখবেন" সাধারণত কাজ করে না
অনেকে একই ধরনের পরীক্ষা-নিরীক্ষা করেছেন: যখন AI কোনো ভুল করে, ব্যবহারকারী তা সংশোধন করে এবং গুরুত্ব সহকারে বলে, "মনে রাখবেন, ভবিষ্যতে আর করবেন না।" তারপর আমি কয়েক দিন পরে আবার জিজ্ঞাসা, এবং এটি সঠিক ছিল.
এটা কোন রহস্য নয়। কারণ প্রশিক্ষণ শেষ হওয়ার পরে এবং মডেলটি স্থাপনের পরে, এটি মানুষের মতো কাজ করার সময় তার দৈনন্দিন অভিজ্ঞতা থেকে শিখতে থাকবে না। অন্তত আজ বেশিরভাগ ভোক্তা পণ্যে, একজন একক ব্যবহারকারী চ্যাট উইন্ডোতে মডেলকে যা বলে তা সরাসরি অন্তর্নিহিত ওজনগুলিকে পুনর্লিখন করে না।
যদি একটি AI পণ্য পরে সত্যিই "ব্যবহারকারীর দ্বারা সংশোধন করা ত্রুটিগুলি মনে রাখে" তবে এটি প্রায়শই মডেলটি নিজেই ক্রমবর্ধমান হওয়ার কারণে নয়, বরং বাইরের সফ্টওয়্যারটি এই সংশোধন রেকর্ডটি সংরক্ষণ করে এবং তারপরে এটিকে প্রসঙ্গ হিসাবে ফিরিয়ে দেয়।
সুতরাং ক্রেডিট এখানে স্পষ্টভাবে আলাদা করা উচিত:
মডেল প্রজন্মের জন্য দায়ী.
সফ্টওয়্যার ইঞ্জিনিয়ারিং সংরক্ষণাগার, পুনরুদ্ধার, ইনজেকশন এবং অর্কেস্ট্রেশনের জন্য দায়ী।
আগেরটির জন্য পরবর্তীটিকে ভুল করে, "এআই জাগ্রত হচ্ছে" হিসাবে "পণ্যটি ভাল করছে" ভুল বোঝা সহজ।
এছাড়াও একটি বিশেষ চমকপ্রদ জিনিস আছে যার নাম "scumbag male (scumbag female) AI"
আমরা যদি আগের শব্দগুলোকে আরও কঠোরভাবে রাখি, তাহলে কিছু পণ্য কেবল "scumbag AI"।
এটি কথা বলতে বিশেষভাবে ভাল, বিশেষত পরিবেশ তৈরিতে ভাল, এবং বিশেষত কীভাবে মানুষকে অনুভব করতে হয় যে "এটি আমাকে ভাল বোঝে", "এটি এত মানবিক" এবং "এর আত্মাটি সম্পূর্ণ"। কিন্তু যখন আপনি এটিকে আলাদা করেন, আপনি দেখতে পাবেন যে অনেক ক্ষেত্রে, প্রতিটি অনুরোধ শুধুমাত্র একটি বড় সেটিং টেক্সট দিয়ে ভরা হয় যা ব্যবহারকারীর প্রশ্নের চেয়ে অনেক বেশি দীর্ঘ।
Openclaw আগুন একটি সাধারণ উদাহরণ. যে কেউ এটি ব্যবহার করেছেন তারা জানেন যে এটি বেশ টোকেন-নিবিড়। কারণটা আসলে রহস্যজনক নয়। এআইকে আরও একটি "মানুষের" মতো করে তোলার জন্য ওপেনক্লা বেশ কিছু নথি ডিজাইন করেছে, যার মধ্যে সবচেয়ে উল্লেখযোগ্য হল AGENTS.md, SOUL.md এবং IDENTITY.md। এই নথিগুলি এআই-এর "ব্যক্তিত্ব", স্বর, পরিচয় এবং মেজাজকে একটি বাগ্মী এবং দীর্ঘ পদ্ধতিতে সংজ্ঞায়িত করে এবং এমনকি এর মানসিক অবস্থাও লিখতে চায়।
সুতরাং ব্যবহারকারী শুধু হ্যালো পাঠালেও, ওপেনক্লা পেছনে অভিবাদনের চেয়ে কয়েক ডজন গুণ দীর্ঘ একটি টেক্সট সংযুক্ত করতে পারে এবং মডেলটিতে একবারে পাঠাতে পারে। দেখে মনে হচ্ছে "এই AI-তে অনেক আত্মা আছে", কিন্তু আসলে অনেক সময় এটি শুধুমাত্র সিস্টেমটি গোপনে অনুরোধে খুব দীর্ঘ ব্যাকগ্রাউন্ড সেটিংস স্টাফ করে।
একটি প্রকৌশল দৃষ্টিকোণ থেকে, এটি অবশ্যই একটি পদ্ধতি। আপনি যদি এটি আরও মৃদু হতে চান তবে "মৃদু" লিখুন; আপনি যদি এটি আরও গল্প বলার মতো হতে চান তবে "গল্প বলা" লিখুন; আপনি যদি এটি একটি গভীর রাতের রেডিও হোস্টের মতো হতে চান, তাহলে গভীর রাত, সাহচর্য, বিরতি, দুর্বলতা, বোঝাপড়া এবং সংযমের সমস্ত কথা প্রম্পট শব্দে লিখুন। চূড়ান্ত প্রভাব প্রায়ই একজন ব্যক্তির মত যে চ্যাট করতে পারেন.
কিন্তু যদি আপনি বুঝতে পারেন যে AI এর সাথে এখন কী চলছে, আপনি জানতে পারবেন: SOUL.md এবং IDENTITY.md এর মতো রহস্যময়-শব্দযুক্ত নামের ফাইলগুলি মূলত প্রম্পট শব্দ প্রকল্প, ডিজিটাল জীবনের জন্য স্ব-নির্দেশ নয়। তারা আউটপুট শৈলী প্রভাবিত করতে পারে, কিন্তু তারা পাতলা বাতাসের বাইরে একটি সত্য অনুভূতি, একটি সত্য আত্ম, বা ব্যক্তিত্বের ধারাবাহিকতার একটি সত্যিকারের অনুভূতি তৈরি করতে পারে না।
অতএব, কিছু পুরানো ব্যবহারকারী Openclaw ইনস্টল করার পরে, তাদের প্রথম প্রতিক্রিয়া হল কনফিগারেশন মুছে ফেলা। SOUL.md এবং IDENTITY.md প্রথমে মুছে ফেলা হয়, AGENTS.md-এ শুধুমাত্র একটি সহজ এবং প্রায় নির্মম বাক্য রেখে: আপনি শুধু একজন কর্মী।
এটি কিছুটা অভদ্র শোনাতে পারে, তবে এটির অন্তত একটি সুবিধা রয়েছে, যা আপনি নিজেকে প্রতারিত করবেন না।
আপনি যদি নৃতাত্ত্বিক AI পছন্দ করেন বা AI এর সাথে ভূমিকা পালন করতে চান তবে অবশ্যই এটি ঠিক আছে। মানুষ আয়নার সাথে কথা বলতে পারে, সুইপিং রোবটদের নাম দিতে পারে এবং আবহাওয়ার পূর্বাভাসকে বলতে পারে, "আপনি আজকে খুব নির্ভুল হয়েছেন।" এগুলি স্বাভাবিক এবং এমনকি মজারও হতে পারে।
তবে এটি মনে রাখা সর্বদা ভাল: এটি একটি গেম প্রথম এবং একটি অভিজ্ঞতা দ্বিতীয়৷ এই গেমটিতে মানুষের অনেক অনুভূতি AI এর লুকানো অভ্যন্তরীণ চিন্তাভাবনা থেকে আসে না, বরং সিস্টেম ডিজাইন, প্রম্পট শব্দ বিন্যাস এবং ব্যবহারকারীর নিজস্ব মানসিক অভিক্ষেপ থেকে আসে। আরও স্পষ্ট করে বলতে গেলে, এআই-এর দিকে অনেক পদক্ষেপ এখনও মূলত ইচ্ছাপূর্ণ চিন্তাভাবনা।
চূড়ান্ত বিশ্লেষণে, মিথ কম এবং বোঝা বেশি
আমি AI-তে ঠান্ডা জল ফেলার চেষ্টা করছি না। বিপরীতে, এটি যত কম দেবীকৃত হবে, ততই আপনি দেখতে পাবেন যে এটি কতটা শক্তিশালী।
এটি শক্তিশালী নয় কারণ এটি কিছু নতুন ঈশ্বরের মতো; এটি সঠিকভাবে শক্তিশালী কারণ এটি সত্যিই একটি জ্ঞানীয় প্রযুক্তি হতে পারে যা গণনাযোগ্য, প্রকৌশলী এবং পুনরুত্পাদনযোগ্য। এটি এমন অনেকগুলি ক্ষমতাকে অনুমতি দেয় যা অতীতে শুধুমাত্র "মানব প্রতিভা" এর অন্তর্গত বলে মনে হয় প্রথমবারের জন্য একটি বড় মাপের, নিম্ন-সীমারেখা এবং কলযোগ্য পদ্ধতিতে প্রদর্শিত হতে। এটি যথেষ্ট মর্মান্তিক এবং অতিরিক্ত নাটকের প্রয়োজন নেই।
অবশ্যই, এআই এখনও দ্রুত পুনরাবৃত্তি করছে। আমি মোটেও অবাক হব না যদি কেউ প্রকৃতপক্ষে মানুষের স্মৃতি, ক্রমাগত শেখার, আবেগ তৈরি করা, এমনকি ভবিষ্যতে আত্ম-টেকসই করার একটি প্রক্রিয়া আবিষ্কার করে এবং এটিকে AI-তে নির্ভরযোগ্যভাবে প্রকৌশলী করে।
কিন্তু সেই দিন না আসা পর্যন্ত, আমি এখনও কিছু সরল বাস্তববাদী অভ্যাস বজায় রাখতে পছন্দ করি: আরও সন্দেহ, আরও বোঝ এবং কম অনুমান করা।
লিবারেল আর্টস বন্ধুদের জন্য যারা এআই নিয়ে আলোচনা করতে আগ্রহী, এই গুণটি আরও গুরুত্বপূর্ণ হতে পারে। লিবারেল আর্টস শিক্ষার্থীরা মিষ্টি বাগ্মিতায় আরও ভাল হতে পারে। যা সত্যিই কঠিন তা হল এমন একটি যুগে যেখানে "এটি একটি আত্মা হয়ে উঠেছে" সর্বত্র অতিরঞ্জিত হচ্ছে, আপনার এখনও পার্থক্য করার ধৈর্য রয়েছে:
মডেল ক্ষমতা কি?
পণ্য প্যাকেজিং কি?
সফটওয়্যার ইঞ্জিনিয়ারিং কি?
কোনটি আমরা খুব বেশি বিশ্বের জন্য প্লট সম্পূর্ণ করতে চাই যে শুধু.
এবং এই বিষয়টি, শেষ পর্যন্ত, আমাদের নিজস্ব রায় রক্ষার বিষয়ে।
রেফারেন্স লিঙ্ক
- স্যাম অল্টম্যানের উত্তর
- TechCrunch-এর পর্বের কভারেজ (2025-04-20): https://techcrunch.com/2025/04/20/your-politeness-could-be-costly-for-openai/