বন্ধুর সাথে অনেকদিন পর দেখা। তাই একটা সেলফি তুলে ফেসবুকে আপলোড দিয়ে দিলাম। কিন্তু শুধু ছবিটাই কি ছড়িয়ে পড়লো অনলাইন জগতে? না, এর মাঝে লুকানো রয়েছে ছবিটা কখন তোলা হয়েছিলো, কোথায় তোলা হয়েছিলো, যে ফোনে তোলা হয়েছে তার মডেলসহ নানা তথ্য। প্রতিনিয়ত অনলাইনে ছবি, ভিডিও থেকে শুরু করে নানা গুরুত্বপূর্ণ ফাইল শেয়ার করা হচ্ছে। এসবের সাথে আনুসাঙ্গিকভাবে ছড়িয়ে যাচ্ছে আরও কিছু তথ্য যা থাকে লোকচক্ষুর আড়ালে। এই তথ্যগুলো কতটা গুরুত্বপূর্ণ? কোনো ক্ষতি হবে কি এর দ্বারা? চলুন জেনে আসা যাক।
মেটাডেটার পরিচয়
কোনো তথ্যের সম্পর্কে তথ্যকে মেটাডেটা বলে। বেশিরভাগ তথ্য-প্রযুক্তি সংশ্লিষ্ট খাতে ‘মেটা’ উপসর্গটির অর্থ হলো ‘লুকোনো/মৌলিক বর্ণনা’ অর্থাৎ একটি তথ্য/ফাইলের নিজের সম্পর্কে বর্ণনা। মেটাডেটা কোনো তথ্যের সারমর্ম প্রদান করে, যার ফলে তথ্য ও উপাত্ত খুঁজতে এবং তাদের নিয়ে কাজ করতে সুবিধা হয়। এটি স্বয়ংক্রিয়ভাবে তৈরি হতে পারে কিংবা ম্যানুয়ালি তৈরি করা যেতে পারে।
তথ্য-প্রযুক্তিতে মেটাডাটা গুরুত্বপূর্ণ পরিচয় বহন করে। যেমন ধরুন, আপনি গুগলে কিছু সার্চ করলেন। আপনি যা খোঁজার জন্য গিয়েছিলেন তার একটি মেটাডেটা আপনার মনে তৈরি হয়ে গিয়েছিলো। সার্চটি যদি হয়ে থাকে জাফলং নিয়ে, তাহলে তার মেটাডেটার মাঝে অন্যতম হবে জাফলং একটি ‘জায়গা’। মেটাডেটা ৭টি সাধারণ প্রশ্নের উত্তর করে থাকে। অর্থাৎ কোনো তথ্য সম্পর্কে ৭টি তথ্য। এগুলো হলো:
- কী?
- কখন?
- কীভাবে?
- কোথায়?
- কে?
- কোনটি?
- কেন?
প্রথমে একটি ছবির মেটাডেটা নিয়ে কথা বলেছিলাম। চলুন, কিছু ছবির সাহায্যে মেটাডেটার ধারণাটি আরও পরিষ্কার করে নেয়া যাক।
প্রথমেই একটি ছবির কথা বলা হয়েছে। এই ছবিটিতে ফাইলের নাম, ফাইলের মালিক, তারিখ, সাইজসহ আরও যেসব তথ্য রয়েছে সেগুলো হলো সাধারণ মেটাডেটার উদাহরণ। ধারণা আরও পরিষ্কার করার জন্য আরও কয়েকটি ছবি দেখা যাক।
এখানে ওয়ার্ড ডকুমেন্টটির Properties অংশে যা আছে সবই মেটাডেটা। সাধারণ ফিল্ডগুলো হলো:
- Title
- Subject
- Author
- Company
- Status
- Creation date and time
- Last modification date and time
- Number of pages
প্রতিটি ওয়েবসাইটের কিছু সাধারণ মেটাডেটা রয়েছে। এর মাঝে উল্লেখযোগ্য হলো:
- Page title
- Page description
- Icon.
এসব মেটাডেটার খুব সাধারণ কিছু উদাহরণ। এর বাইরেও বিভিন্ন উদ্দেশ্যে এর বিস্তৃত ব্যবহার রয়েছে।
মেটাডেটার প্রকারভেদ
মেটাডেটার ব্যবহারের ক্ষেত্রগুলোকে তিনভাগে ভাগ করা যায়- স্ট্রাকচারাল, অ্যাডমিনিস্ট্রেটিভ বা টেকনিক্যাল এবং ডেস্ক্রিপ্টিভ বা বর্ণনামূলক।
স্ট্রাকচারাল বা গঠনমূলক মেটাডেটা
গঠনমূলক মেটাডেটা কোনো ডিজিটাল বস্তু কীভাবে সাজানো থাকে তা নির্দেশ করে। যেমন- একটি বইয়ে তার পাতাগুলো যেভাবে সাজানো থাকে, প্রতিটি অধ্যায়ে বিভক্ত থাকে। এছাড়া তথ্যটি কোনো একাধিক উৎসের সাথে সম্পর্কিত কি না বা অন্য কোনো ক্ষেত্রে ব্যবহার হয়েছে কি না তা নির্দেশ করে। স্ট্রাকচারাল মেটাডেটায় যেসব তথ্য উল্লেখ থাকতে পারে তা হলো:
- কোনো বইয়ের পাতার সংখ্যা
- অধ্যায়ের সংখ্যা
- ভাগের সংখ্যা
- সূচিপত্র প্রভৃতি
এছাড়া কোনো ছবি এর মূল সংস্করণে আছে নাকি এডিট করা তা বোঝার জন্যও এই মেটাডেটা ব্যবহার করা হয়।
অ্যাডমিনিস্ট্রেটিভ মেটাডেটা
কোনো তথ্যের কারিগরি বিষয়াদি নির্দেশ করে। এই মেটাডেটার অন্তর্ভুক্ত তথ্য হচ্ছে কোনো ডকুমেন্টের ফাইল টাইপ, কীভাবে এবং কখন তৈরি হয়েছিলো প্রভৃতি। কপিরাইট ডকুমেন্ট কিংবা ক্লোজড সোর্স ফাইল সংরক্ষণে এটি কাজে দেয়। এই টাইপের মেটাডেটা নির্ধারণ করে দেয় ফাইলটি কখন, কোথায় ব্যবহার করা যাবে বা ব্যবহার করতে কোনো লাইসেন্সের প্রয়োজন কি না। ‘দ্য ন্যাশনাল ইনফর্মেশন স্ট্যান্ডার্ডস অর্গানাইজেশন’ অনুযায়ী অ্যাডমিনিস্ট্রাটিভ মেটাডাটাকে তিন ভাগে ভাগ করা যায়।
- টেকনিক্যাল মেটাডেটা: কোনো ফাইল ডিকোড কিংবা রেন্ডার করার জন্য।
- প্রিজারভেশন মেটাডেটা: ডিজিটাল সম্পদের দীর্ঘমেয়াদি সংরক্ষণ রক্ষণাবেক্ষণের জন্য।
- রাইটস মেটাডেটা: বৌদ্ধিক সম্পত্তি জাতীয় তথ্য এবং কপিরাইট ব্যবহারের অধিকার সম্পর্কিত।
এসব ছাড়াও কোনো ছবির ক্ষেত্রে অ্যাডমিনিস্ট্রেটিভ মেটাডেটা হতে পারে ক্যামেরা মডেল, লেন্স মডেল, লাইট সোর্স ইত্যাদি। মূলত এই মেটাডেটা ব্যবহার করা হয় যাতে কোনো ফাইলের স্বকীয়তা বজায় রাখার জন্য।
বর্ণনামূলক মেটাডেটা
কোনো ফাইল বা তথ্য শনাক্ত করা কিংবা খুঁজে বের করার জন্য বর্ণনামূলক মেটাডেটা অপরিহার্য। লাইব্রেরিতে যখন কোনো বই খোঁজা হয় আমরা সেই সেলফে আগে খুঁজি যেখানে ঐ প্রকারের বইগুলো রয়েছে। এই যে কোনো তথ্যের ‘প্রকার’, এটিই হচ্ছে বর্ণনামূলক মেটাডেটা। অর্থাৎ কোনো তথ্য তার নিজস্ব যে বিষয়গুলো ধারণ করে। মূলত বর্ণনামূলক মেটাডেটা সেসব তথ্যকে নির্দেশ করে যেগুলো ব্যবহার করে ঐ তথ্যের সংশ্লিষ্ট ফাইল খুঁজে বের করা যাবে। ISBN এর মতো অনন্য কোনো শনাক্তকারী পন্থা, রং বা আইকন ব্যবহার করে আলাদা করা কিছু বর্ণনামূলক মেটাডেটার উদাহরণ।
মেটাডেটা ব্যবহারের কারণ কী? অনলাইন ব্যবহার ক্ষেত্রগুলো কী কী?
আপাতত একটি ধারণা হওয়া উচিত যে, ডিজিটাল সম্পদের বিশাল যে সংগ্রহ রয়েছে তার মাঝে ঘুরে বেড়ানো কিংবা দরকারি বিষয়গুলো দ্রুত খুঁজে পাওয়ার জন্য মেটাডেটা জরুরি। মেটাডেটা না থাকলে হয়তো আপনাকে তথ্যের সাগরে হারিয়ে যেতে হত। চাইলেই আমরা কিছু খুঁজে পেতাম না, কিংবা কখনোই পেতাম না।
কোনো ওয়েবসাইটের সফলতার পেছনে রয়েছে মেটাডেটা। কোনো ওয়েবসাইটের মেটাডেটার মাঝে থাকে ওয়েবসাইটের ছোট বর্ণনা, কি-ওয়ার্ড, ট্যাগ ইত্যাদি। এসব ছাড়া কোনো ওয়েবসাইট সার্চ রেজাল্টে আসতো না। আমরা ইন্টারনেটে যখন কিছু সার্চ করি, তখন আমদের সার্চ করা অংশটি ওয়েবসাইটগুলোর সাথে মিলিয়ে দেখা হয়।
ট্র্যাকিংয়ের ক্ষেত্রে মেটাডেটার ব্যবহার: বিভিন্ন ধরনের ই-কমার্স সাইটে মেটাডেটা ব্যবহার করে ভোক্তাদের পছন্দ, অভ্যাস পর্যবেক্ষণ করা হয়। ডিজিটাল মার্কেটিংয়ে ভোক্তাদের প্রতিটি ক্রয়, ক্লিক এবং কার্টের তথ্যাদি মনিটর করা হয়। এছাড়া কোন টাইপের ডিভাইস ব্যবহার হচ্ছে, লোকেশন, সময় এবং যাবতীয় তথ্যাদি, যা বৈধতার মাঝে থেকেই মনিটর করা যাবে, সেগুলোও এর অন্তর্ভুক্ত। এসব তথ্য দিয়ে তারা ভোক্তাদের একটি প্রোফাইল তৈরি করে। এরপর ভোক্তাদেরকে তাদের পছন্দের বা প্রয়োজনের জিনিস প্রদর্শন করে।
আইএসপি, সরকারি মন্ত্রণালয় এবং অন্য যে কেউ, যাদের আইনী প্রবেশাধিকার রয়েছে, তারা এই বিশাল মেটাডেটা ব্যবহার করে থাকে। ব্যবহারকারীদের ইমেইল, ওয়েবসাইটসহ আরও বিভিন্ন জায়গা থেকে তারা এই মেটাডেটা সংগ্রহ করে।
যেহেতু মেটাডেটা প্রধান ডাটাকে চিত্রিত করে, তাই কোনো তথ্য খুঁজতে অনেক কম সময় লাগে। যেমন- কোনো ঘৃণাবাচক কথা কিংবা হুমকি বা ভীতিপ্রদর্শনকারী বক্তব্য ইত্যাদি সহজে বের করা যায়। বিভিন্ন দেশের সরকার এমন তথ্য সংগ্রহ করে থাকে।
সোশ্যাল মিডিয়ায় ব্যবহার: প্রতিবার আপনি যখন ফেসবুকে নতুন বন্ধু বানান বা ইউটিউবে কোনো ভিডিও দেখেন, কোনো স্ট্যাটাস বা পোস্ট শেয়ার করেন, এর পেছনে কাজ করে মেটাডেটা। কাউকে ফ্রেন্ড হিসেবে অ্যাড করার আগে তার সম্পর্কে যে তথ্যগুলো দেখা যায় সেটিও মেটাডেটার অন্তর্ভুক্ত।
মেটাডেটা কি ক্ষতিকর কিছু হতে পারে?
হ্যাঁ, হতে পারে। কিন্তু এর পেছনে আরও কিছু ফ্যাক্টর রয়েছে। শুরুতেই বলা হয়েছে যে, মেটাডেটা কোনো তথ্য নয়, তথ্যের বর্ণনা। যেহেতু মেটাডেটার মাঝে আসল কোনো ডাটা নেই, তাই সেটি নিরাপদভাবে পাবলিকলি ব্যবহার করা যাবে। কোনো ভিডিও বা ওয়েবসাইটের সারমর্ম সেটি নিয়ে কিছু ধারণা দেয়, কিন্তু পুরো তথ্য জানার জন্য তা যথেষ্ট নয়। কোনো বইয়ের শুরুতে লেখক কিছু কথা লেখেন, যা বইটির একপ্রকার সারমর্ম জানায়। সেটি দিয়ে বইটি কোন প্রকারের এটা হয়তো বলা যাবে, কিন্তু বইটি কেমন, তার গল্প কীরূপ তা না পড়লে কখনও জানা যাবে না।
মেটাডেটা কীভাবে ক্ষতির কারণ হতে পারে? অ্যালগরিদম শব্দটির সাথে পরিচিতি রয়েছে আপনার? নেই? তাহলে অপেক্ষা করুন পরবর্তী পর্বের জন্য!