ধরুন আপনি কখনো রোর বাংলার নাম শোনেননি। এমন সময় কেউ একজন আপনাকে জানাল, রোর বাংলা চমৎকার একটি ওয়েবসাইট। আপনি হয়তো তার কথাকে খুব একটা গুরুত্ব দিবেন না। কিন্তু যদি আপনার সামনে পরিসংখ্যানলব্ধ বিভিন্ন সংখ্যা এবং লেখচিত্র হাজির করে দেখানো হয় যে, রোর বাংলার জনপ্রিয়তা বৃদ্ধির হার দেশের বহুল পরিচিত কোনো গণমাধ্যমের চেয়েও বেশি, আপনি নিঃসন্দেহে নড়েচড়ে বসবেন।
কিন্তু একটু লক্ষ্য করলেই আপনি বুঝতে পারবেন, এখানে খুবই সহজ একটি চালাকি করা হয়েছে। এখানে রোর বাংলার জনপ্রিয়তা অমুক পত্রিকার চেয়ে বেশি- এটি দাবি করা হয়নি। বরং দাবি করা হয়েছে, এর জনপ্রিয়তা বৃদ্ধির হার সেই পত্রিকার চেয়ে বেশি। এই পরিসংখ্যান শতভাগ সত্য হতে পারে, কিন্তু এর উদ্দেশ্যটা হচ্ছে রোর বাংলা আসলে যতটা জনপ্রিয়, তাকে তারচেয়েও বেশি জনপ্রিয় হিসেবে উপস্থাপন করা।
এটি খুবই সহজ একটি উদাহরণ। কিন্তু এরচেয়েও অনেক জটিল এবং কার্যকর পদ্ধতিতে বিভিন্ন প্রতিষ্ঠান প্রতিনিয়তই বিজ্ঞাপন আকারে আমাদের সামনে তাদের পণ্যের গুণাগুণ সম্বলিত এমন সব তথ্য এবং পরিসংখ্যান হাজির করছে, যেগুলো হয়তো মিথ্যা নয়, কিন্তু কৌশলে সেগুলো আমাদেরকে প্রতারিত করছে। চলুন জেনে নিই এমন কিছু বহুল ব্যবহৃত কৌশলের কথা।
অপ্রতিনিধিত্বশীল তথ্যের উৎস বাছাই করা
পরিসংখ্যানের প্রথম শর্ত হচ্ছে, যাদের উপর জরিপ করে পরিসংখ্যানের তথ্য ও উপাত্ত সংগ্রহ করা হবে, তাদেরকে বাছাই করতে হবে এমনভাবে, যেন তারা মূল জনসংখ্যাকে সঠিকভাবে প্রতিনিধিত্ব করে। কিন্তু কোনো অনেক প্রতিষ্ঠানই নিজেদের পণ্যকে অধিক গ্রহণযোগ্য প্রমাণ করার জন্য ইচ্ছাকৃতভাবে এমন উৎস বাছাই করতে পারে, যেখান থেকে প্রাপ্ত ফলাফল তাদের পক্ষেই যাবে। উদাহরণস্বরূপ আমরা খুব সহজেই দাবি করতে পারি, অনলাইন পাঠকদের মধ্যে ৮০ শতাংশেরই প্রথম পছন্দ রোর বাংলা। কিন্তু এই জরিপটি যদি আমরা চালিয়ে থাকি শুধুমাত্র রোর বাংলার পাঠকদের উপর, তাহলে নিশ্চিতভাবেই তা বাস্তবতা থেকে অনেক ভিন্ন হবে।
Y অক্ষকে ইচ্ছেমতো ব্যবহার করা
পরিসংখ্যানের উৎস এবং প্রকৃত ফলাফল যা-ই হোক না কেন, ফলাফল উপস্থাপন করার সময় অনেক ক্ষেত্রেই চালাকির আশ্রয় নেওয়া হয়। এক্ষেত্রে সবচেয়ে বহুল ব্যবহৃতগুলো পদ্ধতিগুলোর একটি হচ্ছে, গ্রাফ আকারে ফলাফল উপস্থাপনের সময় Y অক্ষকে ইচ্ছেমতো পরিবর্তন করা। যেমন উপরের প্রথম চিত্রটি ১৯৯২ সালে গাড়ি নির্মাতা প্রতিষ্ঠান শেভ্রলের একটি বিজ্ঞাপন থেকে নেওয়া। এখানে তারা দাবি করেছে, অন্য যেকোনো কোম্পানীর ট্রাকের তুলনায় শেভির ট্রাকগুলো অনেক বেশি নির্ভরযোগ্য, কারণ শেষ ১০ বছরে বিক্রি হওয়া শেভির ৯৮ শতাংশই ট্রাকই বাজারে সচল।
একনজরে গ্রাফটি দেখলে মনে হতে পারে, শেভির কার্যকারিতা আসলেই ফোর্ডের তুলনায় দ্বিগুণ। কিন্তু ভালোমতো লক্ষ্য করলেই বোঝা যাবে, বাস্তবে তাদের মধ্যে পার্থক্য খুবই সামান্য, ২ শতাংশের চেয়েও কম। গ্রাফে এত বেশি ব্যবধান মনে হওয়ার কারণ হচ্ছে, এখানে Y অক্ষকে ০% থেকে শুরু না করে ৯৫% থেকে শুরু করা হয়েছে। Y অক্ষকে যতবেশি সংকুচিত করা হবে, ব্যবধান তত প্রকট মনে হবে। যদি Y অক্ষকে ০% থেকে শুরু করে গ্রাফটিকে পুনরায় উপস্থাপন করা হয়, তাহলেই প্রকৃত চিত্রটি ফুটে উঠবে। উপরের দ্বিতীয় চিত্রটিতে সেটিই ফুটে উঠেছে।
উপরের গ্রাফদুটির ক্ষেত্রেও একই ঘটনা ঘটেছে। প্রথমটিতে Y অক্ষকে সংকুচিত করে ফলাফল ৭৪ থেকে ৮২ শতাংশের মধ্যে সীমাবদ্ধ রাখার কারণে মনে হচ্ছে, সাম্প্রতিক সময়ে মার্কিন যুক্তরাষ্ট্রের প্রাপ্তবয়স্কদের মধ্যে চাকরির হার দুই দশকের মধ্যে সর্বনিম্ন। কিন্তু একই তথ্য গ্রাফের মাধ্যমে উপস্থাপন করার সময় Y অক্ষকে শূন্য থেকে শুরু করলেই দেখা যাবে, এই পার্থক্য উল্লেখযোগ্য তেমন কিছুই না।
গ্রাফে ক্রমযোজিত সংখ্যা ব্যবহার করা
ধরা যাক, কোনো কোম্পানীর পণ্য বিক্রয়ের হার তুলনামূলকভাবে হ্রাস পেয়েছে অথবা আশানুরূপ বৃদ্ধি পায়নি। তারপরেও গ্রাহকদেরকে আকৃষ্ট করার জন্য তাদের সামনে এমন পরিসংখ্যান উপস্থাপন করা প্রয়োজন, যেন মনে হয় তাদের বিক্রয়ের হার বুঝি ক্রমান্বয়ে বেড়েই চলেছে। এরকম ক্ষেত্রে বিক্রয়লব্ধ অর্থের ক্রমযোজিত পরিমাণ ব্যবহার করাটা বেশ কার্যকর একটি পদ্ধতি।
উদাহরণস্বরূপ, উপরের প্রথম চিত্রের অ্যাপলের আইফোন বিক্রয়ের ২০১৩ সালের গ্রাফটি লক্ষ্য করা যেতে পারে। এখানে যদিও বলা আছে এটি ক্রমযোজিত বিক্রয়ের পরিমাণ, কিন্তু একনজর দেখে এ থেকে সহজে বোঝার কোনো উপায় নেই প্রকৃতপক্ষে প্রতি বছর কত সংখ্যক আইফোন বিক্রি হয়েছে। অনেকেই হয়তো এ থেকে একটি ভ্রান্ত ধারণা পাবেন যে, আইফোনের বিক্রয় প্রতিনিয়ত গুণোত্তর হারে বেড়েই চলেছে। কিন্তু দ্বিতীয় গ্রাফটি দেখলেই প্রকৃত চিত্রটি পরিষ্কারভাবে ফুটে উঠবে।
গ্রাফের প্রচলিত রীতি ভঙ্গ করা
যেকোনো তথ্য গ্রাফের মাধ্যমে প্রকাশ করার কিছু সর্বজনগ্রাহ্য রীতি আছে। যেমন X অক্ষের মান বাম থেকে ডানে এবং Y অক্ষের মান নিচ থেকে উপরে ক্রমান্বয়ে বৃদ্ধি পাবে। কিন্তু মাঝে মাঝে এ ধরনের রীতি ভঙ্গ করে মানুষের সামনে এমনভাবে তথ্য উপস্থাপন করা হয়, যা মানুষকে সম্পূর্ণ বিপরীত ধারণা দেয়। যেমন উপরের গ্রাফটি ২০১৪ সালের রয়টার্সের একটি গ্রাফ, যা দেখলে মনে হতে পারে মার্কিন যুক্তরাষ্ট্রের ফ্লোরিডাতে সাম্প্রতিক সময়ে গুলি বর্ষণে নিহতের পরিমাণ গত কয়েক দশকের মধ্যে সর্বনিম্ন। কিন্তু Y অক্ষের লেবেলের দিকে লক্ষ্য করেই বোঝা যাবে এখানে রীতি ভঙ্গ করে Y অক্ষের মান উপর থেকে নিচের দিকে বৃদ্ধি করা হয়েছে। ফলে যেটাকে সাধারণ দৃষ্টিতে সর্বনিম্ন মনে হচ্ছে, সেটাই আসলে সর্বোচ্চ।
আংশিক তথ্য উপস্থাপন করা
উপরের লেখচিত্রগুলো লক্ষ্য করুন। এখানে প্রতিটি চিত্র ভিন্ন। কিন্তু এগুলোর বৈশিষ্ট্য হচ্ছে, প্রতিটি ক্ষেত্রেই x এর গড় মান ৯, y এর গড় মান ৭.৫, x এর ভেদাঙ্ক ১১, y এর ভেদাঙ্ক ৪.১২ এবং x ও y এর সংশ্লেষণ ০.৮১৬। তথ্যগুলোকে যদি লেখচিত্রের মাধ্যমে উপস্থাপন না করে শুধুমাত্র টেবিল আকারে তাদের গড় মান এবং আন্তঃসম্পর্কগুলো উপস্থাপন করা হয়, তাহলে পরিপূর্ণ চিত্র প্রকাশ পাবে না এবং মানুষ ভুল ধারণা পাবে।
যেমন, যদি প্রথম এবং দ্বিতীয় চিত্রটি হয় যথাক্রমে কোনো প্রতিষ্ঠানের পুরুষ এবং নারীদের গড় আয়ের হিসেব, তাহলে শুধুমাত্র তথ্য থেকে মনে হবে, উভয়েই সমান আয় করছে। কিন্তু লেখচিত্র দেখলে পরিষ্কারভাবেই বোঝা যাবে যে, নারীদের আয় সাম্প্রতিক সময়ে কোনো কারণে নিম্নমুখী অবস্থায় আছে। কাজেই এরকম ক্ষেত্রে মানুষকে পরিপূর্ণ ধারণা দেওয়ার জন্য তথ্য এবং লেখচিত্র উভয়ই প্রকাশ করা উচিত। কিন্তু অনেক সময় বিভিন্ন প্রতিষ্ঠান তাদের নিজেদের স্বার্থ অনুযায়ী শুধু তথ্য, অথবা শুধু লেখচিত্র প্রকাশ করে থাকে।
একইভাবে উপরের চিত্র দুটো লক্ষ্য করা যেতে পারে। এখানে প্রথমটি হচ্ছে মার্কিন যুক্তরাষ্ট্রের ন্যাশনাল রাগবি চ্যাম্পিয়ানশিপ, সুপার বৌলের গত তিন দশকের দর্শকসংখ্যার লেখচিত্র। শুধুমাত্র এই চিত্রটি দেখিয়ে দাবি করা সম্ভব, সময়ের সাথে সাথে খেলাটির জনপ্রিয়তা বৃদ্ধি পেয়েছে। কিন্তু তা পুরোপুরি সত্য না। কারণ দ্বিতীয় চিত্রে জনসংখ্যা বৃদ্ধি, টেলিভিশনের মালিকানা প্রভৃতি বিবেচনা করে যখন তথ্যগুলো মোট সংখ্যায় প্রকাশ না করে শতকরায় প্রকাশ করা হয়েছে, তখন দেখা গেছে খেলাটির জনপ্রিয়তা প্রায় আগের মতোই আছে।
গড়ের যথেচ্ছ ব্যবহার
সাধারণত গড় বলতে আমরা গাণিতিক গড়কেই বুঝে থাকি। কিন্তু গাণিতিক গড় সব সময় কাঙ্ক্ষিত তথ্য প্রকাশ করে না। ফলে পরিসংখ্যানে গাণিতিক গড় ছাড়াও মধ্যমা (উপাত্তগুলোকে ক্রমান্বয়ে সাজানোর পর মাঝামাঝি মান) এবং মোড (সবচেয়ে বেশিসংখ্যকবার উপস্থিত মান) নামে দুটি বিশেষ গড় ব্যবহার করা হয়। কিন্তু সাধারণ মানুষ এগুলোর পার্থক্য না জানার কারণে সহজেই এ ধরনের পরিসংখ্যান দ্বারা প্রতারিত হতে পারে।
ধরুন, আপনি এমন একটি এলাকায় বাড়ি কিনতে চান, যেখানে অধিকাংশ মানুষই মোটামুটি স্বচ্ছল। আপনি একটি বিজ্ঞাপনী প্রতিষ্ঠান থেকে এমন একটি এলাকার সন্ধান পেলেন, তাদের দাবি অনুযায়ী যেখানে প্রতিটি পরিবারের “গড় মাসিক আয়” ১ লাখ টাকা। গড়ে সবার আয় ১ লাখ টাকা হলে আপনার চাহিদা অনুযায়ী আপনার আশেপাশের অধিকাংশ মানুষের আয়ই ১ লাখের কাছাকাছি হওয়ার কথা। কিন্তু এলাকায় স্থায়ী হওয়ার পর আপনি আবিষ্কার করলেন, বাস্তবে এলাকার অধিকাংশ মানুষের আয়ই ১ লাখের চেয়ে অনেক অনেক কম।
কারণটা আর কিছুই না। এখানে আপনার প্রয়োজন ছিল ‘মধ্যমা’ অথবা ‘মোড’, কিন্তু জানানো হয়েছে গাণিতিক গড়। গাণিতিক গড় হিসেব করলে এলাকার অধিকাংশ মানুষ দরিদ্র হওয়া সত্ত্বেও মাত্র পাঁচ-দশজন কোটিপতির কারণে পুরো এলাকার গড় আয় ১ লাখ টাকা হয়ে যেতে পারে। আপনাকে যদি বলা হতো এলাকার মানুষের আয়ের মধ্যমা ৬০,০০০ টাকা, অথবা মোড ৫০,০০০ টাকা, তাহলে আপনি অপেক্ষাকৃত বাস্তব চিত্র পেতেন।
বিভিন্ন প্রতিষ্ঠান প্রায় সময়ই সাধারণ মানুষের এ অজ্ঞতাকে কাজে লাগিয়ে তাদেরকে বিভ্রান্ত করে থাকে। নিজেদের স্বার্থ অনুযায়ী তারা বিভিন্ন সময় বিভিন্ন গড় ব্যবহার করে, কিন্তু সব সময়ই সেটাকে শুধুমাত্র ‘গড়’ হিসেবে উপস্থাপন করে।
শুধু উপরে বর্ণিত এ কয়টি পদ্ধতি না, প্রতিনিয়তই বিভিন্ন কৌশলে আমাদেরকে ধোঁকা দেওয়া হচ্ছে পরিসংখ্যান ব্যবহার করে। কাজেই শুধুমাত্র সংখ্যা এবং পরিসংখ্যানলব্ধ তথ্য দেখলেই সেটা বিশ্বাস করা বুদ্ধিমানের কাজ না। আমাদেরকে সব সময়ই এর সাথে থাকা লেবেলগুলো সাবধানে পড়ে দেখতে হবে। যে শব্দগুলো ব্যবহার করা হয়েছে, সেগুলোর প্রকৃত অর্থ সম্পর্কে ধারণা রাখতে হবে। খুঁজে দেখতে হবে তথ্যগুলো ঠিক কোন পদ্ধতিতে সংগ্রহ করা হয়েছে, কাদের উপর, কত সংখ্যক মানুষের উপর জরিপ করা হয়েছে এবং কোন প্রতিষ্ঠান জরিপ করেছে।
ফিচার ইমেজ- lynda.com