Welcome to Roar Media's archive of content published from 2014 to 2023. As of 2024, Roar Media has ceased editorial operations and will no longer publish new content on this website.
The company has transitioned to a content production studio, offering creative solutions for brands and agencies.
To learn more about this transition, read our latest announcement here. To visit the new Roar Media website, click here.

পরিসংখ্যানের মাধ্যমে যেভাবে আপনাকে ধোঁকা দেওয়া হচ্ছে প্রতিনিয়ত

ধরুন আপনি কখনো রোর বাংলার নাম শোনেননি। এমন সময় কেউ একজন আপনাকে জানাল, রোর বাংলা চমৎকার একটি ওয়েবসাইট। আপনি হয়তো তার কথাকে খুব একটা গুরুত্ব দিবেন না। কিন্তু যদি আপনার সামনে পরিসংখ্যানলব্ধ বিভিন্ন সংখ্যা এবং লেখচিত্র হাজির করে দেখানো হয় যে, রোর বাংলার জনপ্রিয়তা বৃদ্ধির হার দেশের বহুল পরিচিত কোনো গণমাধ্যমের চেয়েও বেশি, আপনি নিঃসন্দেহে নড়েচড়ে বসবেন।

কিন্তু একটু লক্ষ্য করলেই আপনি বুঝতে পারবেন, এখানে খুবই সহজ একটি চালাকি করা হয়েছে। এখানে রোর বাংলার জনপ্রিয়তা অমুক পত্রিকার চেয়ে বেশি- এটি দাবি করা হয়নি। বরং দাবি করা হয়েছে, এর জনপ্রিয়তা বৃদ্ধির হার সেই পত্রিকার চেয়ে বেশি। এই পরিসংখ্যান শতভাগ সত্য হতে পারে, কিন্তু এর উদ্দেশ্যটা হচ্ছে রোর বাংলা আসলে যতটা জনপ্রিয়, তাকে তারচেয়েও বেশি জনপ্রিয় হিসেবে উপস্থাপন করা।

এটি খুবই সহজ একটি উদাহরণ। কিন্তু এরচেয়েও অনেক জটিল এবং কার্যকর পদ্ধতিতে বিভিন্ন প্রতিষ্ঠান প্রতিনিয়তই বিজ্ঞাপন আকারে আমাদের সামনে তাদের পণ্যের গুণাগুণ সম্বলিত এমন সব তথ্য এবং পরিসংখ্যান হাজির করছে, যেগুলো হয়তো মিথ্যা নয়, কিন্তু কৌশলে সেগুলো আমাদেরকে প্রতারিত করছে। চলুন জেনে নিই এমন কিছু বহুল ব্যবহৃত কৌশলের কথা।

অপ্রতিনিধিত্বশীল তথ্যের উৎস বাছাই করা

পরিসংখ্যানের প্রথম শর্ত হচ্ছে, যাদের উপর জরিপ করে পরিসংখ্যানের তথ্য ও উপাত্ত সংগ্রহ করা হবে, তাদেরকে বাছাই করতে হবে এমনভাবে, যেন তারা মূল জনসংখ্যাকে সঠিকভাবে প্রতিনিধিত্ব করে। কিন্তু কোনো অনেক প্রতিষ্ঠানই নিজেদের পণ্যকে অধিক গ্রহণযোগ্য প্রমাণ করার জন্য ইচ্ছাকৃতভাবে এমন উৎস বাছাই করতে পারে, যেখান থেকে প্রাপ্ত ফলাফল তাদের পক্ষেই যাবে। উদাহরণস্বরূপ আমরা খুব সহজেই দাবি করতে পারি, অনলাইন পাঠকদের মধ্যে ৮০ শতাংশেরই প্রথম পছন্দ রোর বাংলা। কিন্তু এই জরিপটি যদি আমরা চালিয়ে থাকি শুধুমাত্র রোর বাংলার পাঠকদের উপর, তাহলে নিশ্চিতভাবেই তা বাস্তবতা থেকে অনেক ভিন্ন হবে।

Y অক্ষকে ইচ্ছেমতো ব্যবহার করা

Y অক্ষকে শূন্য থেকে শুরু না করে গাড়ির কার্যকারিতার গ্রাফ; Source: Ted-Ed

Y অক্ষকে শূন্য থেকে শুরু করে গাড়ির কার্যকারিতার গ্রাফ; Source: Ted-Ed

পরিসংখ্যানের উৎস এবং প্রকৃত ফলাফল যা-ই হোক না কেন, ফলাফল উপস্থাপন করার সময় অনেক ক্ষেত্রেই চালাকির আশ্রয় নেওয়া হয়। এক্ষেত্রে সবচেয়ে বহুল ব্যবহৃতগুলো পদ্ধতিগুলোর একটি হচ্ছে, গ্রাফ আকারে ফলাফল উপস্থাপনের সময় Y অক্ষকে ইচ্ছেমতো পরিবর্তন করা। যেমন উপরের প্রথম চিত্রটি ১৯৯২ সালে গাড়ি নির্মাতা প্রতিষ্ঠান শেভ্রলের একটি বিজ্ঞাপন থেকে নেওয়া। এখানে তারা দাবি করেছে, অন্য যেকোনো কোম্পানীর ট্রাকের তুলনায় শেভির ট্রাকগুলো অনেক বেশি নির্ভরযোগ্য, কারণ শেষ ১০ বছরে বিক্রি হওয়া শেভির ৯৮ শতাংশই ট্রাকই বাজারে সচল।

একনজরে গ্রাফটি দেখলে মনে হতে পারে, শেভির কার্যকারিতা আসলেই ফোর্ডের তুলনায় দ্বিগুণ। কিন্তু ভালোমতো লক্ষ্য করলেই বোঝা যাবে, বাস্তবে তাদের মধ্যে পার্থক্য খুবই সামান্য, ২ শতাংশের চেয়েও কম। গ্রাফে এত বেশি ব্যবধান মনে হওয়ার কারণ হচ্ছে, এখানে Y অক্ষকে ০% থেকে শুরু না করে ৯৫% থেকে শুরু করা হয়েছে। Y অক্ষকে যতবেশি সংকুচিত করা হবে, ব্যবধান তত প্রকট মনে হবে। যদি Y অক্ষকে ০% থেকে শুরু করে গ্রাফটিকে পুনরায় উপস্থাপন করা হয়, তাহলেই প্রকৃত চিত্রটি ফুটে উঠবে। উপরের দ্বিতীয় চিত্রটিতে সেটিই ফুটে উঠেছে।

Y অক্ষকে শূন্য থেকে শুরু না করে আমেরিকার চাকরির পরিমাণের গ্রাফ; Source: VOX

Y অক্ষকে শূন্য থেকে শুরু করে আমেরিকার চাকরির পরিমাণের গ্রাফ; Source: VOX

উপরের গ্রাফদুটির ক্ষেত্রেও একই ঘটনা ঘটেছে। প্রথমটিতে Y অক্ষকে সংকুচিত করে ফলাফল ৭৪ থেকে ৮২ শতাংশের মধ্যে সীমাবদ্ধ রাখার কারণে মনে হচ্ছে, সাম্প্রতিক সময়ে মার্কিন যুক্তরাষ্ট্রের প্রাপ্তবয়স্কদের মধ্যে চাকরির হার দুই দশকের মধ্যে সর্বনিম্ন। কিন্তু একই তথ্য গ্রাফের মাধ্যমে উপস্থাপন করার সময় Y অক্ষকে শূন্য থেকে শুরু করলেই দেখা যাবে, এই পার্থক্য উল্লেখযোগ্য তেমন কিছুই না।

গ্রাফে ক্রমযোজিত সংখ্যা ব্যবহার করা

আইফোনের ক্রমযোজিত বিক্রয়; Source: The Verge

আইফোনের বিক্রয়ের প্রকৃত চিত্র; Source: qz.com

ধরা যাক, কোনো কোম্পানীর পণ্য বিক্রয়ের হার তুলনামূলকভাবে হ্রাস পেয়েছে অথবা আশানুরূপ বৃদ্ধি পায়নি। তারপরেও গ্রাহকদেরকে আকৃষ্ট করার জন্য তাদের সামনে এমন পরিসংখ্যান উপস্থাপন করা প্রয়োজন, যেন মনে হয় তাদের বিক্রয়ের হার বুঝি ক্রমান্বয়ে বেড়েই চলেছে। এরকম ক্ষেত্রে বিক্রয়লব্ধ অর্থের ক্রমযোজিত পরিমাণ ব্যবহার করাটা বেশ কার্যকর একটি পদ্ধতি।

উদাহরণস্বরূপ, উপরের প্রথম চিত্রের অ্যাপলের আইফোন বিক্রয়ের ২০১৩ সালের গ্রাফটি লক্ষ্য করা যেতে পারে। এখানে যদিও বলা আছে এটি ক্রমযোজিত বিক্রয়ের পরিমাণ, কিন্তু একনজর দেখে এ থেকে সহজে বোঝার কোনো উপায় নেই প্রকৃতপক্ষে প্রতি বছর কত সংখ্যক আইফোন বিক্রি হয়েছে। অনেকেই হয়তো এ থেকে একটি ভ্রান্ত ধারণা পাবেন যে, আইফোনের বিক্রয় প্রতিনিয়ত গুণোত্তর হারে বেড়েই চলেছে। কিন্তু দ্বিতীয় গ্রাফটি দেখলেই প্রকৃত চিত্রটি পরিষ্কারভাবে ফুটে উঠবে।

গ্রাফের প্রচলিত রীতি ভঙ্গ করা

রীতি ভঙ্গ করে সম্পূর্ণ বিভ্রান্তিমূলক তথ্য উপস্থাপন; Source: Reuters

যেকোনো তথ্য গ্রাফের মাধ্যমে প্রকাশ করার কিছু সর্বজনগ্রাহ্য রীতি আছে। যেমন X অক্ষের মান বাম থেকে ডানে এবং Y অক্ষের মান নিচ থেকে উপরে ক্রমান্বয়ে বৃদ্ধি পাবে। কিন্তু মাঝে মাঝে এ ধরনের রীতি ভঙ্গ করে মানুষের সামনে এমনভাবে তথ্য উপস্থাপন করা হয়, যা মানুষকে সম্পূর্ণ বিপরীত ধারণা দেয়। যেমন উপরের গ্রাফটি ২০১৪ সালের রয়টার্সের একটি গ্রাফ, যা দেখলে মনে হতে পারে মার্কিন যুক্তরাষ্ট্রের ফ্লোরিডাতে সাম্প্রতিক সময়ে গুলি বর্ষণে নিহতের পরিমাণ গত কয়েক দশকের মধ্যে সর্বনিম্ন। কিন্তু Y অক্ষের লেবেলের দিকে লক্ষ্য করেই বোঝা যাবে এখানে রীতি ভঙ্গ করে Y অক্ষের মান উপর থেকে নিচের দিকে বৃদ্ধি করা হয়েছে। ফলে যেটাকে সাধারণ দৃষ্টিতে সর্বনিম্ন মনে হচ্ছে, সেটাই আসলে সর্বোচ্চ।

আংশিক তথ্য উপস্থাপন করা

ভিন্ন ভিন্ন লেখচিত্রের সারাংশ একই হতে পারে; Source: r-bloggers.com

উপরের লেখচিত্রগুলো লক্ষ্য করুন। এখানে প্রতিটি চিত্র ভিন্ন। কিন্তু এগুলোর বৈশিষ্ট্য হচ্ছে, প্রতিটি ক্ষেত্রেই x এর গড় মান ৯, y এর গড় মান ৭.৫, x এর ভেদাঙ্ক ১১, y এর ভেদাঙ্ক ৪.১২ এবং x ও y এর সংশ্লেষণ ০.৮১৬। তথ্যগুলোকে যদি লেখচিত্রের মাধ্যমে উপস্থাপন না করে শুধুমাত্র টেবিল আকারে তাদের গড় মান এবং আন্তঃসম্পর্কগুলো উপস্থাপন করা হয়, তাহলে পরিপূর্ণ চিত্র প্রকাশ পাবে না এবং মানুষ ভুল ধারণা পাবে।

যেমন, যদি প্রথম এবং দ্বিতীয় চিত্রটি হয় যথাক্রমে কোনো প্রতিষ্ঠানের পুরুষ এবং নারীদের গড় আয়ের হিসেব, তাহলে শুধুমাত্র তথ্য থেকে মনে হবে, উভয়েই সমান আয় করছে। কিন্তু লেখচিত্র দেখলে পরিষ্কারভাবেই বোঝা যাবে যে, নারীদের আয় সাম্প্রতিক সময়ে কোনো কারণে নিম্নমুখী অবস্থায় আছে। কাজেই এরকম ক্ষেত্রে মানুষকে পরিপূর্ণ ধারণা দেওয়ার জন্য তথ্য এবং লেখচিত্র উভয়ই প্রকাশ করা উচিত। কিন্তু অনেক সময় বিভিন্ন প্রতিষ্ঠান তাদের নিজেদের স্বার্থ অনুযায়ী শুধু তথ্য, অথবা শুধু লেখচিত্র প্রকাশ করে থাকে।

সুপার বৌলের দর্শকসংখ্যা; Source: Ted-Ed

সুপার বৌলের শতকরা দর্শকসংখ্যা; Source: Ted-Ed

একইভাবে উপরের চিত্র দুটো লক্ষ্য করা যেতে পারে। এখানে প্রথমটি হচ্ছে মার্কিন যুক্তরাষ্ট্রের ন্যাশনাল রাগবি চ্যাম্পিয়ানশিপ, সুপার বৌলের গত তিন দশকের দর্শকসংখ্যার লেখচিত্র। শুধুমাত্র এই চিত্রটি দেখিয়ে দাবি করা সম্ভব, সময়ের সাথে সাথে খেলাটির জনপ্রিয়তা বৃদ্ধি পেয়েছে। কিন্তু তা পুরোপুরি সত্য না। কারণ দ্বিতীয় চিত্রে জনসংখ্যা বৃদ্ধি, টেলিভিশনের মালিকানা প্রভৃতি বিবেচনা করে যখন তথ্যগুলো মোট সংখ্যায় প্রকাশ না করে শতকরায় প্রকাশ করা হয়েছে, তখন দেখা গেছে খেলাটির জনপ্রিয়তা প্রায় আগের মতোই আছে।

গড়ের যথেচ্ছ ব্যবহার

সাধারণত গড় বলতে আমরা গাণিতিক গড়কেই বুঝে থাকি। কিন্তু গাণিতিক গড় সব সময় কাঙ্ক্ষিত তথ্য প্রকাশ করে না। ফলে পরিসংখ্যানে গাণিতিক গড় ছাড়াও মধ্যমা (উপাত্তগুলোকে ক্রমান্বয়ে সাজানোর পর মাঝামাঝি মান) এবং মোড (সবচেয়ে বেশিসংখ্যকবার উপস্থিত মান) নামে দুটি বিশেষ গড় ব্যবহার করা হয়। কিন্তু সাধারণ মানুষ এগুলোর পার্থক্য না জানার কারণে সহজেই এ ধরনের পরিসংখ্যান দ্বারা প্রতারিত হতে পারে।

ধরুন, আপনি এমন একটি এলাকায় বাড়ি কিনতে চান, যেখানে অধিকাংশ মানুষই মোটামুটি স্বচ্ছল। আপনি একটি বিজ্ঞাপনী প্রতিষ্ঠান থেকে এমন একটি এলাকার সন্ধান পেলেন, তাদের দাবি অনুযায়ী যেখানে প্রতিটি পরিবারের “গড় মাসিক আয়” ১ লাখ টাকা। গড়ে সবার আয় ১ লাখ টাকা হলে আপনার চাহিদা অনুযায়ী আপনার আশেপাশের অধিকাংশ মানুষের আয়ই ১ লাখের কাছাকাছি হওয়ার কথা।  কিন্তু এলাকায় স্থায়ী হওয়ার পর আপনি আবিষ্কার করলেন, বাস্তবে এলাকার অধিকাংশ মানুষের আয়ই ১ লাখের চেয়ে অনেক অনেক কম।

গড়, মধ্যমা এবং মোড; Source: Statistics Help Center

কারণটা আর কিছুই না। এখানে আপনার প্রয়োজন ছিল ‘মধ্যমা’ অথবা ‘মোড’, কিন্তু জানানো হয়েছে গাণিতিক গড়। গাণিতিক গড় হিসেব করলে এলাকার অধিকাংশ মানুষ দরিদ্র হওয়া সত্ত্বেও মাত্র পাঁচ-দশজন কোটিপতির কারণে পুরো এলাকার  গড় আয় ১ লাখ টাকা হয়ে যেতে পারে। আপনাকে যদি বলা হতো এলাকার মানুষের আয়ের মধ্যমা ৬০,০০০ টাকা, অথবা মোড ৫০,০০০ টাকা,  তাহলে আপনি অপেক্ষাকৃত বাস্তব চিত্র পেতেন।

বিভিন্ন প্রতিষ্ঠান প্রায় সময়ই সাধারণ মানুষের এ অজ্ঞতাকে কাজে লাগিয়ে তাদেরকে বিভ্রান্ত করে থাকে। নিজেদের স্বার্থ অনুযায়ী তারা বিভিন্ন সময় বিভিন্ন গড় ব্যবহার করে, কিন্তু সব সময়ই সেটাকে শুধুমাত্র ‘গড়’ হিসেবে উপস্থাপন করে।

শুধু উপরে বর্ণিত এ কয়টি পদ্ধতি না, প্রতিনিয়তই বিভিন্ন কৌশলে আমাদেরকে ধোঁকা দেওয়া হচ্ছে পরিসংখ্যান ব্যবহার করে। কাজেই শুধুমাত্র সংখ্যা এবং পরিসংখ্যানলব্ধ তথ্য দেখলেই সেটা বিশ্বাস করা বুদ্ধিমানের কাজ না। আমাদেরকে সব সময়ই এর সাথে থাকা লেবেলগুলো সাবধানে পড়ে দেখতে হবে। যে শব্দগুলো ব্যবহার করা হয়েছে, সেগুলোর প্রকৃত অর্থ সম্পর্কে ধারণা রাখতে হবে। খুঁজে দেখতে হবে তথ্যগুলো ঠিক কোন পদ্ধতিতে সংগ্রহ করা হয়েছে, কাদের উপর, কত সংখ্যক মানুষের উপর জরিপ করা হয়েছে এবং কোন প্রতিষ্ঠান জরিপ করেছে।

ফিচার ইমেজ- lynda.com

Related Articles