តើអ្វីជា 'ទិន្នន័យធំ' ពិតប្រាកដ?

ហើយហេតុអ្វីវាជារឿងធំ?

'ទិន្នន័យធំ' គឺជាវិទ្យាសាស្រ្តថ្មីនៃការយល់ដឹងនិងព្យាករណ៍ឥរិយាបថរបស់មនុស្សដោយសិក្សាពីទំហំធំនៃទិន្នន័យគ្មានរចនាសម្ព័ន្ធ។ ទិន្នន័យធំត្រូវបានគេស្គាល់ថាជា 'ការវិភាគទស្សន៍ទាយ' ។

ការវិភាគអត្ថបទ Twitter, ហ្វេសប៊ុកមតិព័ត៌មាន, ការស្វែងរករបស់អេឡិចត្រូនិច, កម្មវិធីតាមដាន GPS និងម៉ាស៊ីនអេធីអឹមគឺជាឧទាហរណ៍ទិន្នន័យដ៏ធំមួយ។ ការសិក្សាពីវីដេអូសុវត្ថិភាពទិន្នន័យចរាចរណ៍លំនាំអាកាសធាតុការមកដល់ជើងហោះហើរកំណត់ហេតុអគារទូរស័ព្ទនិងឧបករណ៍តាមដានចង្វាក់បេះដូងគឺជាទម្រង់ផ្សេងៗទៀត។ ទិន្នន័យធំគឺជាវិទ្យាសាស្រ្តថ្មីដែលស្មុគស្មាញដែលផ្លាស់ប្តូររៀងរាល់សប្តាហ៍ហើយមានតែអ្នកជំនាញមួយចំនួនប៉ុណ្ណោះដែលយល់ដឹងទាំងអស់។

តើមានឧទាហរណ៏អ្វីខ្លះនៃទិន្នន័យធំនៅក្នុងជីវិតធម្មតា?

រូបថតអេក្រង់ http://project.wnyc.org/transit-time

ខណៈដែលគម្រោងទិន្នន័យធំ ៗ ភាគច្រើនមិនច្បាស់លាស់នោះមានឧទាហរណ៍ដ៏ធំធេងនៃទិន្នន័យធំ ៗ ដែលប៉ះពាល់ដល់ជីវិតប្រចាំថ្ងៃរបស់បុគ្គលក្រុមហ៊ុននិងរដ្ឋាភិបាល:

ការព្យាករណ៍អំពីការរីករាលដាលនៃវីរុស: តាមរយៈការសិក្សាទិន្នន័យនយោបាយសង្គមទិន្នន័យអាកាសធាតុនិងអាកាសធាតុនិងទិន្នន័យមន្ទីរពេទ្យ / មន្ទីរព្យាបាលអ្នកវិទ្យាសាស្ត្រទាំងនេះកំពុងព្យាករណ៍អំពីជម្ងឺគ្រុនឈាមដែលមានរយៈពេល 4 សប្តាហ៍។

ឃ្លាំមើលមនុស្សឃាត: ទម្រង់ទិន្នន័យគម្រោងទិន្នន័យដ៏ធំនេះសម្លាប់ជនរងគ្រោះជនសង្ស័យនិងឧក្រិដ្ឋជននៅក្នុងទីក្រុងវ៉ាស៊ីនតោនឌីស៊ី។ ទាំងពីរនេះជាមធ្យោបាយមួយដើម្បីគោរពដល់អ្នកស្លាប់និងជាធនធានការយល់ដឹងមួយសម្រាប់មនុស្ស, គម្រោងទិន្នន័យដ៏ធំនេះគឺគួរឱ្យចាប់អារម្មណ៍។

ផែនការធ្វើដំណើរឆ្លងកាត់, ញូវយ៉ក: អ្នកសរសេរកម្មវិធីវិទ្យុ WNYC លោក Steve Melendez បានរួមបញ្ចូលកាលវិភាគផ្លូវក្រោមដីជាមួយកម្មវិធីផ្លូវធ្វើដំណើរ។ ការបង្កើតរបស់គាត់អនុញ្ញាតឱ្យ New Yorkers ចុចទីតាំងរបស់ពួកគេនៅលើផែនទីហើយការព្យាករណ៍នៃពេលវេលាធ្វើដំណើរសម្រាប់រថភ្លើងនិងរថភ្លើងក្រោមដីនឹងបង្ហាញឡើង។

Xerox បានកាត់បន្ថយការបាត់បង់កម្លាំងពលកម្មរបស់ពួកគេ: ការងារមជ្ឈមណ្ឌលធ្វើការហៅគឺអស់កម្លាំងអារម្មណ៍។ ក្រុមហ៊ុន Xerox បានសិក្សាអំពីទិន្នន័យដោយមានជំនួយពីក្រុមអ្នកវិភាគវិជ្ជាជីវៈហើយឥឡូវនេះពួកគេអាចទស្សន៍ទាយថាអ្នកជួលមជ្ឈមណ្ឌលហៅទូរស័ព្ទទំនងជាស្នាក់នៅជាមួយក្រុមហ៊ុនដែលវែងបំផុត។

គាំទ្រការប្រឆាំងអំពើភេរវកម្ម: ដោយសិក្សាពីប្រព័ន្ធផ្សព្វផ្សាយសង្គមកំណត់ត្រាហិរញ្ញវត្ថុការកក់ជើងហោះហើរនិងទិន្នន័យសន្តិសុខការអនុវត្តច្បាប់អាចព្យាករណ៍និងដាក់ទីតាំងជនសង្ស័យភេរវកម្មមុនពេលពួកគេប្រព្រឹត្តអំពើអាក្រក់របស់ពួកគេ។

ការកែតម្រូវទីផ្សារម៉ាកដែលមានមូលដ្ឋានលើការពិនិត្យប្រព័ន្ធផ្សព្វផ្សាយសង្គម : មនុស្សម្នារាតត្បាតយ៉ាងឆាប់រហ័សនិងចែករំលែកគំនិតលើអ៊ីនធឺណិតនៅលើហាងស្រាភោជនីយដ្ឋានឬក្លឹបហាត់ប្រាណ។ វាអាចទៅរួចក្នុងការសិក្សាលើប្រព័ន្ធផ្សព្វផ្សាយសង្គមរាប់លានទាំងនេះនិងផ្ដល់មតិត្រឡប់ដល់ក្រុមហ៊ុនអំពីអ្វីដែលមនុស្សគិតអំពីសេវាកម្មរបស់ពួកគេ។

តើអ្នកណាប្រើប្រាស់ទិន្នន័យធំ? អ្វីដែលពួកគេធ្វើជាមួយវា?

សាជីវកម្មធំ ៗ ជាច្រើនប្រើទិន្នន័យធំដើម្បីកែសម្រួលការផ្តល់និងតម្លៃរបស់ពួកគេដើម្បីបង្កើនការពេញចិត្តរបស់អតិថិជន។

ហេតុអ្វីបានជាទិន្នន័យដ៏ធំបែបនេះជាកិច្ចព្រមព្រៀងធំ?

4 ចំនុចធ្វើឱ្យទិន្នន័យធំ ៗ មានសារៈសំខាន់:

ទិន្នន័យគឺធំ។ វានឹងមិនសមនៅលើ ដ្រាយវ៍រឹងតែមួយ ទេ រន្ធ USB ។ បរិមាណនៃទិន្នន័យនេះមានលើសពីអ្វីដែលមនុស្សអាចយល់បាន (គិតពីមួយកោដិប៊ីនប៊ីកប៊ីម៉ាបហើយបន្ទាប់មកគុណចំនួនរាប់ពាន់លាន) ។

ទិន្នន័យនេះមានលក្ខណៈស្មុគស្មាញនិងមិនមានរចនាសម្ព័ន្ធ។ ការងារទិន្នន័យធំ ៗ ពី 50% ទៅ 80% កំពុងបម្លែងនិងសំអាតពត៌មានដូច្នេះវាអាចស្វែងរកបាននិងអាចបែងចែកបាន។ មានតែអ្នកជំនាញពីរបីពាន់នាក់ប៉ុណ្ណោះនៅលើភពផែនដីយើងដែលដឹងពីរបៀបសម្អាតទិន្នន័យនេះ។ អ្នកជំនាញទាំងនេះក៏ត្រូវការឧបករណ៍ឯកទេសជាច្រើនដូចជា HPE និង Hadoop ដើម្បីធ្វើសិប្បកម្មរបស់ពួកគេ។ ប្រហែលជា 10 ឆ្នាំអ្នកជំនាញទិន្នន័យធំ ៗ នឹងក្លាយទៅជាផេនីរាប់ពាន់ប៉ុន្តែសម្រាប់ពេលនេះពួកគេជាប្រភេទអ្នកវិភាគដ៏កម្រនិងការងាររបស់ពួកគេនៅតែមិនច្បាស់លាស់និងធុញទ្រាន់។

ទិន្នន័យបានក្លាយជាទំនិញ ** ដែលអាចលក់និងទិញបាន។ ទីផ្សារទិន្នន័យមានកន្លែងដែលក្រុមហ៊ុននិងបុគ្គលម្នាក់ៗអាចទិញប្រព័ន្ធទូរគមនាគមន៍សង្គមនិងទិន្នន័យផ្សេងៗទៀត។ ទិន្នន័យភាគច្រើនគឺផ្អែកលើពពកព្រោះវាមានទំហំធំពេកមិនសមស្របទៅនឹងថាសរឹងណាមួយ។ ការទិញទិន្នន័យជាទូទៅពាក់ព័ន្ធនឹងថ្លៃដើមនៃការជាវដែលអ្នកដោតចូលក្នុងកសិដ្ឋានម៉ាស៊ីនបម្រើពពក។

អ្នកដឹកនាំឧបករណ៍និងគំនិតទិន្នន័យធំ ៗ គឺ Amazon, Google, Facebook និង Yahoo ។ ដោយសារតែក្រុមហ៊ុនទាំងនេះបម្រើមនុស្សរាប់លាននាក់ជាច្រើនជាមួយនឹងសេវាអ៊ីនធឺណិតរបស់ពួកគេវាធ្វើឱ្យយល់ថាពួកគេនឹងក្លាយជាចំណុចប្រមូលនិងទស្សនវិស័យនៅពីក្រោយការវិភាគទិន្នន័យធំ ៗ ។

លទ្ធភាពនៃទិន្នន័យដ៏ធំគឺគ្មានទីបញ្ចប់។ ប្រហែលជាគ្រូពេទ្យនឹងព្យាករណ៍ពីការគាំងបេះដូងនិងជំងឺដាច់សរសៃឈាមខួរក្បាលមួយថ្ងៃមុនពេលដែលវាកើតឡើង។ ការធ្លាក់យន្តហោះនិងរថយន្តអាចនឹងត្រូវកាត់បន្ថយដោយការវិភាគព្យាករណ៍អំពីទិន្នន័យមេកានិចនិងចរាចរនិងអាកាសធាតុ។ ការណាត់ជួបតាមអ៊ិនធឺរណែតអាចនឹងត្រូវបានកែលម្អដោយមានអ្នកព្យាករណ៍ទិន្នន័យដ៏ធំដែលជាបុគ្គលិកលក្ខណៈឆបគ្នាសម្រាប់អ្នក។ តន្រ្តីករអាចទទួលបានការយល់ដឹងពីអ្វីដែលសមាសភាពតន្ត្រីគឺជាការពេញចិត្តបំផុតចំពោះការផ្លាស់ប្តូរចំណង់ចំណូលចិត្តនៃទស្សនិកជនគោលដៅ។ អ្នកឯកទេសខាងចំណីអាហារអាចព្យាករណ៍ថាតើថ្នាំដែលបានទិញពីហាងនឹងកាន់តែធ្ងន់ធ្ងរឬជួយដល់ស្ថានភាពសុខភាពរបស់អ្នកជំងឺ។ ផ្ទៃដីត្រូវបានរុំព័ទ្ធតែប៉ុណ្ណោះហើយការរកឃើញនៅក្នុងទិន្នន័យដ៏ធំកើតឡើងរៀងរាល់សប្តាហ៍។

ទិន្នន័យធំ ៗ មានភាពរាយប៉ាយ

Monty Rakusen / Getty

ទិន្នន័យធំគឺការវិភាគលើការព្យាករណ៍: ការបម្លែងទិន្នន័យគ្មានរចនាសម្ព័ន្ធរឹងមាំទៅជាអ្វីមួយដែលអាចស្វែងរកបាននិងអាចបែងចែកបាន។ នេះគឺជាចន្លោះស្មុគស្មាញនិងវឹកវរដែលតម្រូវឱ្យមានប្រភេទពិសេសនៃចំណេះដឹងនិងការអត់ធ្មត់។

យកឧទាហរណ៏សេវាកម្មដឹកជញ្ជូន UPS ។ អ្នកសរសេរកម្មវិធីនៅទិន្នន័យសិក្សារបស់ UPS ពី GPS និងស្មាតហ្វូនរបស់អ្នកបើកបររបស់ពួកគេដើម្បីវិភាគវិធីមានប្រសិទ្ធិភាពបំផុតដើម្បីសម្របខ្លួនទៅនឹងការកកស្ទះចរាចរ។ ទិន្នន័យ GPS និងទូរស័ព្ទស្មាតហ្វូននេះគឺមានទំហំធំ, និងមិនត្រៀមខ្លួនជាស្រេចសម្រាប់ការវិភាគដោយស្វ័យប្រវត្តិ។ ទិន្នន័យនេះបានមកពីប្រព័ន្ធ GPS និងមូលដ្ឋានទិន្នន័យផែនទីជាច្រើនតាមរយៈឧបករណ៍ផ្នែករឹងស្មាតហ្វូនខុសៗគ្នា។ ក្រុមអ្នកវិភាគ UPS បានចំណាយពេលរាប់ខែដើម្បីបម្លែងទិន្នន័យទាំងអស់នោះទៅជាទ្រង់ទ្រាយមួយដែលអាចស្វែងរកនិងតម្រៀបយ៉ាងងាយ។ កិច្ចខិតខំប្រឹងប្រែងនេះមានតម្លៃណាស់។ សព្វថ្ងៃ UPS បានសន្សំប្រេងឥន្ធនៈជាង 8 លានហ្គាឡុងចាប់តាំងពីពួកគេបានចាប់ផ្តើមប្រើទិន្នន័យវិភាគធំ ៗ ទាំងនេះ។

ដោយសារតែទិន្នន័យដ៏ធំស្មុគស្មាញនិងទាមទារការខិតខំប្រឹងប្រែងជាច្រើនដើម្បីសម្អាតនិងរៀបចំសម្រាប់ការប្រើប្រាស់អ្នកវិទ្យាសាស្ត្រទិន្នន័យត្រូវបានគេដាក់ឈ្មោះហៅថា "អ្នកបោសសំអាតទិន្នន័យ" សម្រាប់ការងារធុញទ្រាន់ដែលពួកគេធ្វើ។

វិទ្យាសាស្រ្តនៃទិន្នន័យដ៏ធំនិងការវិភាគទស្សន៍ទាយត្រូវបានធ្វើឱ្យប្រសើរឡើងជារៀងរាល់សប្តាហ៍។ រំពឹងថាទិន្នន័យធំ ៗ នឹងអាចចូលបានងាយស្រួលដល់មនុស្សគ្រប់គ្នានៅឆ្នាំ 2025 ។

ទិន្នន័យធំមិនមែនជាការគំរាមកំហែងចំពោះភាពឯកជនទេ?

Feingersh / Getty

បាទ / ចាសប្រសិនបើច្បាប់របស់យើងនិងការការពារភាពឯកជននីមួយៗមិនត្រូវបានគ្រប់គ្រងដោយប្រុងប្រយ័ត្ននោះទិន្នន័យដ៏ធំចូលទៅក្នុងភាពឯកជន។ ដូចដែលវាឈរ Google និង YouTube និងហ្វេសប៊ុកបានតាមដានតាមទម្លាប់ប្រចាំថ្ងៃរបស់អ្នក ។ ទូរស័ព្ទស្មាតហ្វូននិងជីវិតកុំព្យូទ័ររបស់អ្នកទុកសញ្ញាឌីជីថលជារៀងរាល់ថ្ងៃហើយក្រុមហ៊ុនទំនើប ៗ កំពុងសិក្សាពីស្នាមជើងនោះ។

ច្បាប់ជុំវិញទិន្នន័យធំកំពុងវិវឌ្ឍ។ ភាពជាឯកជនគឺជាស្ថានភាពដែលអ្នកត្រូវតែទទួលខុសត្រូវផ្ទាល់ខ្លួនព្រោះអ្នកមិនអាចរំពឹងថាវាជាសិទ្ធិដើម។

អ្វីដែលអ្នកអាចធ្វើដើម្បីការពារភាពឯកជនរបស់អ្នក:

ជំហានតែមួយគត់ធំបំផុតដែលអ្នកអាចធ្វើបានគឺដើម្បីពង្រឹងទម្លាប់ប្រចាំថ្ងៃរបស់អ្នកដោយប្រើការតភ្ជាប់បណ្តាញ VPN ។ សេវា VPN នឹងបញ្ឆេះសញ្ញារបស់អ្នកដើម្បីឱ្យអត្តសញ្ញាណនិងទីតាំងរបស់អ្នកលាក់ខ្លួនយ៉ាងហោចណាស់ផ្នែកខ្លះពីឧបករណ៍តាមដាន។ វានឹងមិនធ្វើឱ្យអ្នក 100% អនាមិកនោះទេប៉ុន្តែ VPN នឹងកាត់បន្ថយយ៉ាងច្រើនអំពីរបៀបដែលពិភពលោកអាចសង្កេតតាមទម្លាប់អ៊ីនធឺណិតរបស់អ្នក។

តើខ្ញុំអាចស្វែងយល់បន្ថែមអំពីទិន្នន័យធំបានយ៉ាងដូចម្តេច?

Monty Raskusen / Getty

ទិន្នន័យដ៏ធំគឺជារឿងគួរអោយចាប់អារម្មណ៍សម្រាប់មនុស្សដែលមានចិត្តវិទូនិងសេចក្តីស្រឡាញ់ចំពោះបច្ចេកវិទ្យា។ ប្រសិនបើនោះជាអ្នក, បន្ទាប់មកពិតជាទស្សនាទំព័រនៃគម្រោងទិន្នន័យដ៏ធំគួរឱ្យចាប់អារម្មណ៍នេះ។