বিশ্বব্যাপী কোভিড-১৯ ছড়িয়ে পড়ার পর থেকেই আমাদের চারদিকে চোখে পড়ছে অসংখ্য গ্রাফ-চার্ট। কোথাও কোভিড-১৯ এ আক্রান্ত রোগীদের হার বুঝাতে কিংবা অন্য অঞ্চলের সাথে তুলনা করতে, কোথাও ভ্যাক্সিনের ক্লিনিক্যাল ট্রায়ালের তথ্য দিতে, কোথাও লকডাউনের আর্থিক ক্ষতির গ্রাফ দেখাতে। তথ্য-উপাত্ত নিয়ে বিশ্লেষণ আর গবেষণাকারীরা বলছেন, এই দুর্যোগের একেকটি দিনের প্রতি সেকেন্ডে মানুষ তার ইতিহাসকে ছাপিয়ে যাচ্ছে। ভাইরাসের প্রতিরোধে ডাক্তার-নার্সদের সাথে একদম পর্দার আড়াল থেকে লড়াই করছে তথ্য উপাত্ত গবেষকরা। মানুষের মাঝে সচেতনতা তৈরি থেকে শুরু করে সরকার ও আন্তর্জাতিক সংস্থার নীতি নির্ধারণে প্রভাব ফেলছে বিশ্লেষিত তথ্য-উপাত্ত কিংবা মডেল।
ভাইরাসঘটিত এই রোগের আন্তর্জাতিক বিস্তারকে কেন্দ্র করে মানুষের তথ্য সংগ্রহ, সংরক্ষণ, বিভিন্নখাতে এর ব্যবহার এবং উপস্থাপনের ক্ষেত্রে একটি বিপ্লব হয়ে যাচ্ছে। মানুষের কাছ থেকে সুনির্দিষ্ট উপায়ে সংগৃহীত প্রতিটি তথ্য বা ডাটা দীর্ঘদিন ধরেই অমূল্য সম্পদ হিসেবে বিবেচিত হয়ে আসছে। কারণ, এই ডাটা ব্যবহার করে মানুষের আচার আচরণ, অভ্যাসের একটি কাঠামো পাওয়া যায়, যাকে ‘প্যাটার্ন’ বা ‘ট্রেন্ড’ বলা হয়ে থাকে। বিশাল পরিমাণ উপাত্ত বিশ্লেষণ (বিগ ডাটা এনালাইসিস) করে পাওয়া এই প্যাটার্নকে কাজে লাগায় ব্যবসা প্রতিষ্ঠানগুলো। তাদের নতুন পণ্য উদ্ভাবন কিংবা পণ্যের বিজ্ঞাপনে কাজে লাগে এই তথ্য। করোনার সময়ে এমন ‘প্যাটার্ন’ কাজে লাগিয়ে একটি এলাকায় সংক্রমণের ব্যাপার ধারণা পাওয়া যেতে পারে।
তবে শুধু সংক্রমণের ব্যাপারে ধারণা পাওয়াই নয়, আমাদের চোখের আড়ালে জনস্বাস্থ্যের জন্য নেওয়া একেকটি জরুরি সিদ্ধান্তে প্রভাব ফেলছে বিভিন্ন উৎস থেকে ‘ডাটা’। জনস্বাস্থ্য থেকে শুরু করে আমরা প্রতিদিনের সংবাদপত্রে কিংবা সামাজিক যোগাযোগ মাধ্যমে যে গ্রাফ-চার্ট দেখছি সেগুলোও তৈরি হচ্ছে সংগৃহীত তথ্যের ভিত্তিতে।
মানুষের ইতিহাসে মনোযোগ দিয়ে তাকালে দেখা যাবে, ইতিহাসের একটি দীর্ঘ সময় মানুষ তার বিপদ সম্পর্কে আঁচ করতেই ব্যাপক সময় নষ্ট করে ফেলেছে। কিন্তু এই কোভিড-১৯ বিপর্যয় এদিক থেকে বেশ আলাদা। শুরু থেকেই মানুষ বিভিন্ন খাতের অভিজ্ঞতার সমন্বয় করেছে চিকিৎসা খাতে। দীর্ঘদিন যাবত তথ্য উপাত্ত নিয়ে কাজ করার ফলে তার ‘ডাটা সায়েন্স’ নামে যে শাখাটি গড়ে উঠেছে সেটি সুস্পষ্টভাবে অন্য খাতের চেয়ে আলাদা হয়ে ধরা দিয়েছে এই সময়ে। তথ্য উপাত্ত নিয়ে কাজ করার জটিল প্রক্রিয়াকে মোটমাট তিনভাগে ভাগ করা যায়।
- তথ্য সংগ্রহ এবং বাছাই
- তথ্যকে বিশ্লেষণ করা
- তথ্যকে মানুষের কাছে উপস্থাপন করা
প্রথম দুটি ধাপ ঘটে যায় আমাদের চোখের আড়ালেই কারণ আমাদের বেশিরভাগ মানুষই শুধুমাত্র উপস্থাপিত তথ্য আমাদের চোখের সামনে দেখতে পাই, যেমন বিভিন্ন ধরনের গ্রাফ-চার্ট, কোনো ‘ডাটা মডেল’।
প্রথমেই আসা যাক তথ্য সংগ্রহ এবং বাছাইয়ের ধাপে। বেশিরভাগ ক্ষেত্রেই দুনিয়াজুড়েই রোগীদের আক্রান্ত হওয়ার তথ্য আসছে হাসপাতাল এবং ডায়াগনস্টিক ল্যাবগুলো থেকে। গবেষণায় দেখা গেছে, উন্নত দেশের হাসতাপালগুলোতে ‘বিগ ডাটা এনালাইসিস’ শুরু হয়েছে বেশ আগে থেকেই। তবে এখনো বেশিরভাগ ক্ষেত্রেই রোগীর সাথে আলাপ আলোচনা করে তার লক্ষণ বা টেস্টের রেজাল্ট ডাক্তার-স্বাস্থ্যকর্মীরা বের করে আনছেন। সেই তথ্য নিয়ম করে জমা হচ্ছে সফটওয়্যারগুলোতে। বেশিরভাগ ক্ষেত্রেই সবগুলো দেশ তাদের বিভিন্ন অঞ্চল থেকে পাওয়া প্রাথমিক ডাটার সংগ্রহ উন্মুক্ত করছে বিশ্বের সবার জন্য।
দ্বিতীয় এবং তৃতীয় ধাপে আছে প্রাথমিক ডাটার বহুমাত্রিক বিশ্লেষণ, উপস্থাপন এবং বহুবিধ মডেল নির্মাণ। কোভিড-১৯ এর একদম শুরু থেকেই জন্স হপকিন্স বিশ্ববিদ্যালয়ের ‘সেন্টার ফর সিস্টেমস সাইন্স এন্ড ইঞ্জিনিয়ারিং’ নামে একটি বিভাগের অধীনে চালু হয় একটি ড্যাশবোর্ড।
যেখানে বিশ্বের বিভিন্ন প্রান্ত থেকে পাওয়া ডাটার ভিত্তিতে দেখা যাবে মহামারির বর্তমান অবস্থা। ডিসেম্বরে মহামারি শুরু হওয়ার পর থেকেই এই ড্যাশবোর্ডের পরিকল্পনা শুরু হয়। ২০২০ সালের জানুয়ারির বাইশ তারিখে শুরু হওয়ার দিনেই এটি গণমাধ্যম থেকে সামাজিক যোগাযোগ মাধ্যমে ‘ভাইরাল’ হয়ে যায়। মহামারির প্রতিটি দিন অতিবাহিত হওয়ার সাথে সাথে তথ্যের পরিমাণও বাড়তে থাকে, তাই জন্স হপকিন্স তাদের ড্যাশবোর্ডের পাশাপাশি রিসোর্স সেন্টারও চালু করে। ফলে আমেরিকা এবং বাইরে থেকে প্রাপ্ত তাৎক্ষণিক তথ্য (রিয়েল টাইম ডাটা) উপাত্তকে সাজিয়ে মডেল তৈরি করতে থাকে। প্রতি মিনিটে নতুন করে তথ্য আসার সাথে সাথে এই গ্রাফ-চার্টগুলোও নিজের মতো করে হালনাগাদ হতে থাকে। পাশাপাশি জন্স হপকিন্সের ডাটা নিয়ে সামাজিক যোগাযোগ মাধ্যম কিংবা অন্য এনালিস্টরাও নিজেদের মতো করে এনালাইসিস করতে শুরু করেন।
তাই জন্স হপকিন্সের এই ডাটাবেজে প্রতিদিন গড়ে বিলিয়নেরও বেশি ভিজিট শুরু হয়ে যায়। এর আগেও জন্স হপকিন্স বিশ্ববিদ্যালয় হামের (Measles) সংক্রাম্যতা নিয়েও এমন একটি কাজ করার চেষ্টা করেছে। তাই করোনার ক্ষেত্রে এই কাজটি দ্রুত করতে তারা সক্ষম হয়েছে।
শুরুতে এনশেং ডং নামের এক পিএইচডি শিক্ষার্থী এবং তার দলের সদস্যরা সিডিসি, বিশ্ব স্বাস্থ্য সংস্থা এবং বিভিন্ন দেশের মিডিয়া এবং সরকারি ডাটাবেজ থেকে প্রাপ্ত তথ্য ম্যানুয়ালি ইনপুট দিয়ে ড্যাশবোর্ডটি চালু করছিলেন। দিন যাওয়ার সাথে সাথে ‘ওয়েব স্ক্রাপিং’ টেকনোলজি ব্যবহার করে এই ডাটাবেজ নিজেই নিজেকে তাৎক্ষনিকভাবে হালনাগাদ করতে শুরু করে।
শুরু থেকেই জন্স হপকিন্স তাদের ডাটাবেজের সব তথ্য এবং এর যাবতীয় কোড ‘গিটহাব’ অনলাইন কোড শেয়ারিং প্ল্যাটফর্মে উন্মুক্ত করে দেওয়া হয়। ফলে বিভিন্ন দেশের বিজ্ঞানী এবং গবেষকরা চাইলে নিজেদের ডাটা ব্যবহার করে প্রায় একই রকম ড্যাশবোর্ড নিজেরা বানিয়ে নিতে পারবেন।
জন্স হপকিন্স বাদেও বিশ্বের বিভিন্ন প্রান্তের মানুষ ডাটা সায়েন্সকে কাজে লাগিয়ে মানুষের চলাচল এবং আক্রান্তদের চলাচলের প্যাটার্ন ফলো করে ইতালিতে বানানো হয় ‘কোভিড-১৯ মোবিলিটি মনিটরিং প্রোজেক্ট’। মানুষের স্মার্টফোন থেকে লোকেশন ডাটা ব্যবহার করে আপতকালীন সময়ে এ ধরনের বিশ্লেষণ করা হয়েছে।
জন্স হপকিন্স বাদেও বিশ্বের নানা প্রতিষ্ঠান, বিশ্ববিদ্যালয় তাদের গবেষণার ডাটা, তাদের তৈরি ড্যাশবোর্ড, ডাটা উপস্থানের কোড উন্মুক্ত করে দেয় গিটহাবে শেয়ার করার মাধ্যমে।
এর সবচেয়ে বড় সুবিধা হলো পাবলিক হেলথ বা জনস্বাস্থ্যের জন্য গুরুত্বপূর্ণ পদক্ষেপ নিতে এ ধরনের ডাটা এক অমূল্য রত্ন ভাণ্ডার। আগামী দিনগুলোতে ডাক্তার স্বাস্থ্যকর্মীদের কী পরিমাণ রোগীদের সেবা দিতে হতে পারে, স্বাস্থ্যসেবাকে কোথায় বা কোন এলাকায় সবচেয়ে বেশি ঘনীভূত করা দরকার, কোথায় রোগীরা সেরে উঠছে। কোন বয়সের রোগীরা কেমন ঝুঁকিতে আছে তা নির্ধারণে এই ডাটা নীতি নির্ধারক, ডাক্তার-স্বাস্থ্যকর্মী, প্রশাসন সবাইকে সহায়তা করছে।
মহামারিতে তাই ডাক্তার-নার্স স্বাস্থ্যকর্মীদের সাথে কম্পিউটার স্ক্রীনের পেছনে কাজ করছেন হাজার হাজার ডাটা গবেষক, মহামারির গতিপথ, সাম্ভাব্য ভ্যাক্সিন, নীতি নির্ধারণী পর্যায়ে গুরুত্বপূর্ণ সিদ্ধান্তের পেছনে রয়ে গেছেন এরা।
কোভিড-১৯ বিপর্যয় শেষ হলেও কিন্তু এই ডাটা সায়েন্সের গুরুত্ব কমবে না, নিত্য নতুন যেকোনো স্থানিক মহামারি (Local epidemic) যেকোনো সময় হয়ে উঠতে পারে বিশ্বব্যাপী আরেকটি কোভিড-১৯। তাই ‘বিগ ডাটা এনালাইসিস’, ‘ডাটা সায়েন্স’র এই দুর্যোগকালীন শিক্ষা আমাদেরকে সামনেও নতুন করে ভাবতে শেখাবে।