একবিংশ শতাব্দী হচ্ছে প্রযুক্তি ও কম্পিউটারের যুগ। এমন কোনো ক্ষেত্র নেই, যেখানে এখন কম্পিউটার ব্যবহার করা হয় না। প্রতিদিন যতটুকু সময় কম্পিউটার ব্যবহার করা হয় এবং এ ব্যবহারের ফলে যত তথ্য তৈরি হয়, তার পরিমাণ গুণে শেষ করা যাবে না। যত দিন যাচ্ছে ডাটার পরিমাণ বৃদ্ধি পাচ্ছে। যত দিন যাচ্ছে প্রযুক্তির উন্নতি হচ্ছে, জীবন সহজ হয়ে যাচ্ছে, পাশাপাশি প্রযুক্তি ব্যবহারও সহজ হয়ে যাচ্ছে। এর ফলে এত উপাত্ত তৈরি হচ্ছে যে শুধুমাত্র সেই উপাত্ত এবং তথ্য ব্যবহার করে তা বিশ্লেষণ করলেই অনেক বিষয় স্পষ্ট হয়ে যায় এবং ডাটা সম্পর্কে নতুন নতুন তথ্য বের হয়।
তথ্য-প্রযুক্তিতে উন্নতির ফলে একটি শিল্প প্রতিষ্ঠানে যে পরিমাণ ডাটা তৈরি হয়, শুধু তা বিশ্লেষণ করেই এখন বিভিন্ন প্রতিষ্ঠান বাজারে তাদের পণ্য টিকিয়ে রাখতে পারে এবং অন্য প্রতিষ্ঠানের সাথে প্রতিযোগিতা করতে পারে। শেষ দুই বছরে পৃথিবীর ৯০ শতাংশ ডাটা তৈরি হয়েছে কম্পিউটারে। প্রতিদিন গড়ে ২.৫ কুইনটিলিয়ন বাইট (পঁচিশ শো কোটি বিলিওন) ডাটা তৈরী হয়েছে। এত এত ডাটা বা উপাত্তকে বলা হয় বিগ ডাটা। প্রযুক্তির উন্নতির ফলে এখন দৈত্য সমান ডাটা সংরক্ষণ করা যায় এবং এসব ডাটার মধ্যে যেগুলো কাঠামোবদ্ধ (Structured) এবং এলোমেলো (Unstructured), সেগুলোকে নির্দিষ্ট গাণিতিক প্রক্রিয়ার মাধ্যমে প্রক্রিয়াজাত (Processing) করা এবং সেখান থেকে নতুন নতুন তথ্য উদঘাটন করা সম্ভব হয়।
বিগ ডাটাতে 3 V’s বলে একটি কথা আছে। এই তিনটি ‘ভি’ হচ্ছে– ডাটার পরিমাণ (Volume), ডাটার বৈচিত্র্য (Variety) এবং ডাটা সংগ্রহ ও সংরক্ষণ করার সময় (Velocity)। বিগ ডাটাতে উপাত্তের পরিমাণ হবে প্রচুর। নির্দিষ্ট করে বললে, এর পরিমাণ কয়েক গিগাবাইট বা পেটাবাইট হতে পারে। এদের থেকে কয়েকশো গুণ বেশিও হতে পারে। এই ডাটার মধ্যে বৈচিত্র্য থাকবে। অর্থাৎ শুধু একই ধরনের তথ্যই শুধু বিগ ডাটা প্রদান করবে না। সংখ্যায় বিভিন্ন তথ্য দেয়ার পাশাপাশি এতে থাকবে ছবি, ভিডিও ইত্যাদির মতো তথ্য।
বিগ ডাটার মাধ্যমে তথ্য আসার সময় নেবে অনেক কম। উদাহরণ দিলে ব্যাপারটি আরো পরিষ্কার হবে। যেমন আধুনিক শহরগুলোর রাস্তাগুলোতে ডিটেক্টর বসানো থাকে। সেই ডিটেক্টরের কাজ হচ্ছে কত বেগে গাড়ি যাচ্ছে, রাস্তায় বিভিন্ন সময়ে কতগুলো গাড়ি চলাচল করেছে, রাস্তার একক দৈর্ঘ্যতে কী পরিমাণ গাড়ি আসছে, রাস্তায় বড় গাড়ির পরিমাণ কত ইত্যাদি শনাক্ত করা। বিশেষ কম্পাংক ব্যবহার করে এই তথ্যগুলোর সিগন্যাল পাঠানো হয় এবং সিগন্যালগুলো সংখ্যায় পরিবর্তিত হয়ে একটি ফলাফল দেয়। পুরো ব্যাপারটিই কিন্তু কয়েক মাইক্রো সেকেন্ডের মধ্যে হয়ে থাকে। অর্থাৎ সময় অনেক কম লাগে, যে কাজ স্বাভাবিক প্রক্রিয়ায় করতে অনেক সময় লাগতো।
একটি ফ্রিওয়ের এ ধরনের ডাটা যদি আমরা ৬ মাসের জন্য সংগ্রহ করি, তাহলে দেখা যাবে ডাটার পরিমাণ প্রায় ২০ গিগাবাইট। এ ধরনের ডাটা হচ্ছে বিগ ডাটা। অনেক কম সময়ের মধ্যে আসল ডাটা আমরা পাচ্ছি এবং যে সময়ে একটি ঘটনা ঘটছে, তার কাছাকাছি সময়ের তথ্য আমরা পাচ্ছি। অনেক দিনের পুরনো ডাটা কিন্তু সংগ্রহ হচ্ছে না। এই ধরনের ডাটাকে বলা হয় রিয়েল টাইম ডাটা। বিগ ডাটায় Velocity বলতে একেই বোঝায়।
বিগ ডাটার এই তিনটি ‘ভি’ ব্যবহার করে ব্যবসায়ীক প্রতিষ্ঠানগুলো এখন তাদের ব্যবসার কাজে সিদ্ধান্ত নিয়ে থাকে। সেটা অর্থনীতিতে হোক, প্রযুক্তি খাতে হোক, মার্কেট গবেষণায় হোক বা স্বাস্থ্যখাতে হোক- সবাই হাতেনাতে এর সুফল ভোগ করছে। বরং এখন এমন অবস্থা দাঁড়িয়েছে যে যদি বিগ ডাটা ব্যবহার না করা হয়, তাহলে প্রতিযোগিতায় টিকে থাকা প্রায় অসম্ভব। পর্যবেক্ষণ করে দেখা গিয়েছে যে, বিগ ডাটা ব্যবহার করে সিদ্ধান্ত নিলে ব্যবসায় ক্ষতির সম্ভাবনা প্রায় ৮৯ শতাংশ পর্যন্ত এড়িয়ে যাওয়া যায়।
বিগ ডাটা যখন ব্যবহার করা শুরু হলো, তখন দেখা গেল যে এসব ডাটার ভেতর আরো কিছু প্যাটার্ন পাওয়া যায়। সেগুলো অর্থনীতির বিভিন্ন নীতি নির্ধারণ করতে সাহায্য করে। তখন বিগ ডাটার বিশাল আয়তনের তথ্য বিশ্লেষণের জন্য জটিল গাণিতিক মডেল তৈরির দিকে ঝুঁকলো গবেষকরা। বিভিন্ন প্রতিষ্ঠান বিশাল বিশাল ডাটা থেকে সঠিকভাবে যেন তথ্য উদঘাটন করা যায়, সেজন্য গণিত এবং পরিসংখ্যান ব্যবহার করে বিভিন্ন অ্যালগরিদম দাঁড় করাতে লাগলো, যা Algorithmic Trading বলে পরিচিত। অর্থনীতি নিয়ে কাজ করে এমন প্রতিষ্ঠানগুলো এভাবে তাদের কাজের একটি অংশ হিসেবে বিগ ডাটা ব্যবহার করা শুরু করেছে। বিগ ডাটা ব্যবহার করার ফলে বিশ্ব অর্থনীতির এখন বিরাট পরিবর্তন হচ্ছে। বিশেষ করে আর্থিক সংকট আগেভাগে বুঝে যাওয়ার ক্ষেত্রে আমূল উন্নতি হয়েছে।
নিজেদের পণ্য প্রচার করতে আগে থেকে বিভিন্ন উপায় অবলম্বন করতে হতো পণ্যের কোম্পানিকে। কিন্তু এখন সোশ্যাল মিডিয়া হয়ে যাবার কারণে খুব সহজেই নিজেদের বর্তমান পণ্যগুলোকে সবার নজরে আনা যায় এবং বিক্রিতেও এই নজরে আনার ব্যপারটা প্রভাব ফেলে। কিন্তু সমস্যা হচ্ছে সেসব গ্রাহকদের খুঁজে বের করা, যারা এই পণ্যের সাথে আগেও পরিচিত ছিল এবং খুব সহজেই পণ্যগুলোকে চিনে একে গ্রহণ করতে পারবে। এ ধরনের কাজের জন্য বিগ ডাটা খুব সাহায্য করে।
সোশ্যাল মিডিয়াতে কী ধরনের পণ্য বেশি খোঁজা হয়, কারা এই পণ্য বেশি খোঁজে, দিনের কখন এই পণ্য সন্ধানের হার বেশি, কমেন্ট বক্সগুলোতে গ্রাহক কী ধরনের জিনিস বেশি চাচ্ছে- এসব ডাটা সহজেই কিনতে কিংবা বের করে আনা যায়। এগুলো থেকে পরে তথ্য বিশ্লেষণ করে সিদ্ধান্ত নিতে হয়। কোন বৈশিষ্টের পণ্য তৈরি করলে গ্রাহকদের কাছে তা অধিক গ্রহণযোগ্যতা পাবে, কোন বয়সের গ্রাহকদের লক্ষ্য করে পণ্যগুলোকে বাজারে ছাড়তে হবে, কোন সময়ে পণ্যটির প্রচার করলে গ্রাহকদের ভেতর পণ্যটির একটি চাহিদা তৈরি করা যাবে- এসব বিষয়ে গবেষণা এবং সিদ্ধান্ত গ্রহণের জন্য বিগ ডাটার বিকল্প নেই। এসবের ফলে যেকোনো ব্যবসায়িক প্রতিষ্ঠানের লাভ ছাড়া ক্ষতি হবে না, কারণ বিগ ডাটা খুবই সচ্ছল একটি প্রক্রিয়া।
এই বিগ ডাটার মাধ্যমে এলোমেলো তথ্য থেকেও গুরুত্বপূর্ণ তথ্য বের করে আনা যায়। বর্তমানে ডাটা মাইনিং, মেশিন লার্নিং, টেক্সট মাইনিং ইত্যাদি ব্যবহার করে অর্থনৈতিক নীতি নির্ধারণে অসাধ্য সাধন করা যাচ্ছে। এর কারণ হচ্ছে নতুন নতুন প্রযুক্তি এবং অনেক শক্তিশালী কম্পিউটার তৈরি হবার ফলে। টেক্সট মাইনিং নিয়ে কাজ করলে গ্রাহক কোনো একটি পণ্য সম্পর্কে কী ধরনের অনুভূতি প্রকাশ করছে, সেটা পর্যন্ত খুঁজে বের করা যায়। এমনকি তার মন্তব্যের গুরুত্ব কতটুকু, সেটিও বের করা যায়। এসব কারণে বিভিন্ন প্রতিষ্ঠানে এখন বিগ ডাটা ব্যবহার করা হচ্ছে।
আরো বিভিন্ন কাজে বিগ ডাটা ব্যবহার করা হচ্ছে। যেমন, ইনস্যুরেন্স কোম্পানিগুলোতে পেনশন স্কিম এবং অন্যান্য সেবার প্রভাব; এখন কী ধরনের বিনিয়োগ করলে পরে গ্রাহকরা বেশি ইনস্যুরেন্স করবে; ভবিষ্যতে কোম্পানির নিজের কী কী লাভ হবে ইত্যাদি সিদ্ধান্তগুলো বিগ ডাটা প্রয়োগ করে করা হয়। বিশেষ করে আগের পলিসিগুলোর থেকে ডাটা নিয়ে এ কাজগুলো করা হয়। তাছাড়া যেসব প্রতিষ্ঠান শুধু বিনিয়োগ করে এবং যারা শুধু সম্পদ ব্যবস্থাপনা নিয়ে কাজ করে তারাও পূর্বের ডাটাগুলো থেকে তথ্য বিশ্লেষণ করে যেকোনো বিষয়ে সিদ্ধান্ত নিয়ে থাকে।
বড় বড় অনলাইনভিত্তিক সেবা প্রতিষ্ঠানগুলো কিন্তু এই বিগ ডাটা দিয়েই তাদের কাজ পরিচালনা করে। আমাজন, ফেসবুক, আলিবাবা, টেনসেন্ট এরা সবাই বিগ ডাটার উপর নির্ভরশীল। এমনকি আমাদের দেশের মিডিয়া প্রতিষ্ঠানগুলোও বিগ ডাটা ব্যবহার করে তাদের সাথে যুক্ত মানুষের পছন্দ অনুযায়ী সংবাদ প্রকাশ করতে পারে। এতে আর্থিকভাবে লাভবানের পাশাপাশি গ্রাহকদের কাছে গ্রহণযোগ্যতাও আরও কয়েকগুণ বেড়ে যাবে। তাছাড়া অন্যান্য প্রতিষ্ঠানের সাথে প্রতিযোগিতায় একটি অন্যমাত্রা যোগ করা যাবে এবং মিডিয়াতে নিজেদের একটি স্বতন্ত্র জায়গা করে নেয়া যাবে।
ফিচার ইমেজ সোর্স: internet-idee.net