<div id="MiddleColumn_internal"> <h3>அறிமுகம்</h3> <p style="text-align: justify;">கடந்த 2008ம் ஆண்டின் இறுதியில் உருவாக்கப்பட்ட தரவு அறிவியல் என்ற பாடம், இன்றைய நிலையில் பெரிய வரவேற்பை பெற்றுள்ளது. போர்ப்ஸ் மற்றும் சி.என்.என்., போன்ற முக்கிய சர்வேக்கள், தரவு விஞ்ஞானி பணியை, இன்றைய நிலையில், மிகுந்த வளர்ச்சியடைந்த பணிகளுள் ஒன்றாக மதிப்பிட்டுள்ளன.</p> <h3>தகவல் என்ற சக்தி</h3> <p style="text-align: justify;">உலகெங்கிலுமுள்ள நிறுவனங்கள், கடந்த சில, பல ஆண்டுகளின் தகவல்களை திரட்டி வைத்திருப்பதை பெரிய பொக்கிஷமாக கருதுகின்றன. ஏனெனில், அவற்றை அடிப்படையாக வைத்து, பல முக்கிய முடிவுகள் எடுக்கப்பட்டு, போட்டி உலகில் அந்நிறுவனங்கள் நிலைத்து நிற்க ஏதுவாக அமைகிறது. தேவையான டேட்டாக்களை எடுத்து சேகரிக்கும் பணிக்கு அதீத தனித்திறமை தேவைப்படுகிறது. அத்திறமையைப் பெற்றவர்கள்தான் தரவு விஞ்ஞானிகள்.</p> <h3>டேட்டாக்களின் வகைகள்</h3> <p style="text-align: justify;">Facebook, LinkedIn மற்றும் Twitter போன்ற நிறுவனங்கள், பெரியளவிலான டேட்டா செயல்பாட்டில் முக்கியத்துவம் வகிக்கின்றன. நாம் ஒரு நாளைக்கு, 2.5 quintillion வரையிலான டேட்டா பைட்ஸ்களை உருவாக்குகிறோம் என்று ஒரு புள்ளிவிபரம் தெரிவிக்கிறது. இவற்றில் கட்டமைக்கப்பட்ட மற்றும் கட்டமைக்கப்படாத டேட்டாக்கள் என்ற இரு வகைகள் உண்டு. சர்வேக்கள் மற்றும் feedback forms போன்றவை கட்டமைக்கப்பட்ட டேட்டா வகைகளிலும், வீடியோக்கள், பிளாக்குகள் மற்றும் posts போன்றவை, கட்டமைக்கப்படாத டேட்டா வகைகளிலும் சேரும். இத்தகைய கணக்கிலடங்காத, பல வகைகளிலான டேட்டாக்களை தேவைக்கேற்ற வகையில் பிரித்தெடுத்து பயன்பாட்டிற்கு கொண்டு வருவதே தரவு விஞ்ஞானிகளின் முக்கியப் பணி.</p> <h3 style="text-align: justify;">பல பரிமாணங்கள்</h3> <p style="text-align: justify;">தாங்கள் சேகரித்த எண்ணற்ற டேட்டாக்களிலிருந்து, தேவையான விஷயங்களை தேவையான முறையில் எடுத்து, எழுத்து வடிவில் அல்லது காட்சி வடிவில், சம்பந்தப்பட்டவர்களுக்கு இந்த டேட்டா சயின்டிஸ்டுகள் வழங்குகிறார்கள். இந்த வகையில், ப்ரோகிராமர்களாக, அனலிஸ்டுகளாக, புள்ளியியல் நிபுணர்களாக, பொறியாளராக, ஆர்டிஸ்டாக மற்றும் கதை சொல்பவராக ஒரு தரவு விஞ்ஞானி, பல்வேறு பரிமாணங்களில் பரிணமிக்கிறார்.</p> <p style="text-align: justify;">Moneyball என்ற திரைப்படத்தை நம்மில் சிலர் பார்த்திருக்கலாம் அல்லது கேள்விப்பட்டிருக்கலாம். இது நிஜக்கதையின் அடிப்படையில் எடுக்கப்பட்ட ஒரு படம். இப்படத்தில், யேல் பல்கலையில் படித்த ஒரு பொருளாதார பட்டதாரி, பேஸ்பால் திறனைத் தேர்ந்தெடுக்க, எண்களைப் பயன்படுத்துவார். ஆனால் இந்த செயல்முறையானது, விரும்பிய முடிவுகளையே தர தொடங்கிய பின்பு, அது நிராகரிக்கப்பட்டது. இதன்மூலம் நாம் அறிந்துகொள்வது என்னவெனில், ஒரு தரவு விஞ்ஞானியின் திறமை, பல்வேறு துறைகளிலும் ஜொலிக்கக் கூடியது என்பதை அறிந்து கொள்ளலாம்.</p> <h3>ஒட்டுமொத்த திறன்கள்</h3> <p style="text-align: justify;">புள்ளியியல் என்பது டேட்டா சயின்ஸ் செயல்பாட்டின் இலக்கணம் (Grammar) போன்றது மற்றும் அதுதான் அதற்கான அடிப்படைத் திறன். பெரியளவிலான டேட்டா அமைப்புகளுக்கு, புள்ளியியல் மாதிரிகளை கட்டமைத்தல் மற்றும் புள்ளியியல் பகுப்பாய்வை பயன்படுத்துதல் ஆகிய செயல்பாடுகளில், இத்துறை சார்ந்த ஒருவர் நிபுணத்துவம் பெறுவது அவசியம். மேலும், code எழுதுவதிலும் வல்லமை பெறுதல் அவசியம். ஆனால் இந்த code எழுதும் செயல்முறை, தொழில்நுட்ப வளர்ச்சியினால் இனிவரும் காலங்களில் தேவைப்படாது என்று கூறப்படுகிறது.</p> <p style="text-align: justify;">இவைத்தவிர, தரவு விஞ்ஞானிகள், சிறந்த கம்ப்யூடேஷனல் மற்றும் எண் திறன்களைக் கொண்டிருக்க வேண்டும். தற்போதைய வணிக சூழலுடன் பொருந்திய அறிவுடன், சொற்கள் மற்றும் காட்சி வகையிலான, வலுவான தகவல் தொடர்பு திறனைப் பெற்றிருக்க வேண்டும்.</p> <h3>உயர்ந்தபட்ச தகுதிகள்</h3> <p style="text-align: justify;">அதிகபட்ச ஆர்வம், பிரச்சினைக்கு உள்ளே சென்று ஆராயும் மனப்பாங்கு, முக்கிய கேள்விகளுக்கு சரியான பதில்களை கண்டடைதல் போன்றவை, இத்துறை நிபுணர்களுக்கான சிறந்த தகுதிகள். இதனால்தான், டேட்டா நிபுணர்கள், டேட்டா சயின்டிஸ்டுகள் என்று அழைக்கப்படுகிறார்கள். ஒரு செயல்பாட்டு இயற்பியல் அறிஞர், சாதனங்களை வடிவமைக்க வேண்டும், தரவை சேகரிக்க வேண்டும், பல்வேறான சோதனை முயற்சிகளை மேற்கொள்ள வேண்டும் மற்றும் முடிவுகளைத் தெரிவிக்க வேண்டும். எனவே, ஒரு டேட்டா சயின்டிஸ்ட் என்பவரை, இயற்பியல் வல்லுநர், கணிப்பொறி அறிவியல், கணிதம் அல்லது பொருளாதார நிபுணர் ஆகியோருக்கு சமமாக ஒப்பிடலாம்.</p> <h3 style="text-align: justify;">தரவு அறிவியல் துறையில் நுழைதல்</h3> <p style="text-align: justify;">வலுவான டேட்டா மற்றும் கம்ப்யூடேஷனல் அம்சங்களைக் கொண்ட எந்த துறையை சார்ந்தவரும், டேட்டா சயின்டிஸ்ட் என்ற நிலைக்கு வர முடியும். மானுடவியல் மற்றும் தொல்லியல் துறையை சார்ந்த ஆராய்ச்சி நிபுணர்கள்கூட, தங்களின் அதிகளவு தரவு பயன்பாட்டு திறனால், டேட்டா சயின்டிஸ்ட் என்ற நிலைக்கு உயர்ந்துள்ளனர். இயற்பியல் அறிஞர், ப்ரோகிராமர், கணிதவியல் நிபுணர், கலை நிபுணர் உள்ளிட்ட பல தகுதி நிலைகளில் ஒரு தரவு விஞ்ஞானி பொருந்தி வந்தாலும், தொழில்முனையும் பண்பானது அவருக்கு இருக்க வேண்டிய முக்கியமான தகுதிகளில் ஒன்றாகும்.</p> <h3>துறைக்குள் நுழைதல்</h3> <p style="text-align: justify;">ஒருவர் எப்படி தரவு விஞ்ஞானி ஆகலாம்? தரவு விஞ்ஞானி என்ற பணி நிலைக்கான ஆள் தேவை எண்ணிக்கைக்கும், படித்து வெளிவரும் பட்டதாரிகளின் எண்ணிக்கைக்கும் பெருத்த இடைவெளி உள்ளது. இந்தியாவைப் பொறுத்தவரை, ஒரு சில கல்வி நிறுவனங்கள்தான், தகுதியான முறையில் இப்படிப்பை வழங்குகின்றன. அதேசமயம், எம்.பி.ஏ., படித்த ஒருவர், தனது தொழில்நுட்பத் திறனை வளர்த்துக்கொண்டு, புள்ளியியல் மென்பொருள் ப்ரோகிராமில் சான்றிதழ் பெறலாம்.</p> <p style="text-align: justify;">நீங்கள் ஐ.டி., துறையில் இருந்தாலும், எம்.பி.ஏ., படித்து இத்துறைக்குள் நுழையலாம். ஏனெனில், வணிகத்தைப் புரிந்துகொள்ளல் மற்றும் அதை வழங்குதல் போன்ற திறன்கள் அவசியமானவை. அதேசமயம், புள்ளியியல் திறன் அமைப்பை வளர்த்துக் கொள்ளுதல் என்பது சற்று சிக்கலானது. இந்தியாவில் ஒரு சில கல்வி நிறுவனங்களே, SAS மற்றும் SPSS போன்ற புள்ளியியல் tool -களில் முறையான பயிற்சிகளை வழங்குவதோடு, பகுப்பாய்வு மற்றும் புள்ளியியல் மாடலிங் தொழில்நுட்பங்களில் அடிப்படைத் திறனையும் வழங்குகின்றன.</p> <h3>எதிர்காலம்</h3> <p style="text-align: justify;">உருவாக்கப்படும் டேட்டாக்களின் எண்ணிக்கை அதிகரிக்கப்படவுள்ளது. இத்துறை நிபுணர்கள், எதிர்காலத்தில், பல்வேறான நிறுவனங்களில் பணி வாய்ப்புகளைப் பெறுவார்கள். இத்துறை நிபுணர்களுக்கான தேவைகள், நாளுக்கு நாள் அதிகரித்து வருகின்றன. எனவே, எதிர்காலம் பிரமாதமானதாக இருக்கும் என்பதில் சந்தேகமேயில்லை.</p> <p style="text-align: justify;"><strong>ஆதாரம் : தினமலர் – வெற்றி வழிகாட்டி கையேடு</strong></p> </div>