👋 สวัสดีจ้าาา วันนี้แอดจะพาเพื่อน ๆ มาทำความรู้จักกับ Data Lakes กันน !! มันคืออะไร สำคัญยังไง มาหาคำตอบไปพร้อม ๆ กันเลยจ้าาา
.
📑 Data Lakes - เป็นศูนย์รวมการเก็บข้อมูลจากทุก ๆ แหล่ง สามารถเก็บข้อมูลแบบ Structured หรือ Unstructured ก็ได้ ไม่ต้องเปลี่ยนแปลงข้อมูลก่อนการจัดเก็บ และสามารถดึงข้อมูลมาใช้ได้อย่างรวดเร็ว โดยข้อมูลเหล่านี้จะนำมาใช้ในการวิเคราะห์, สร้าง Dashboard, รวมไปถึงการประมวลผล Big Data และ Machine Learning
.
🌈 Data Lakes พัฒนาเพื่อลบข้อจำกัดของ Data Warehouse แม้ว่า Data Warehouse จะช่วยให้ธุรกิจมีการวิเคราะห์ข้อมูลที่มีประสิทธิภาพสูง แต่มันก็ยังมีข้อจำกัดในเรื่องของราคาและเรื่องการปรับขนาด ซึ่งมันจะทำให้เสีย Cost ตรงนี้มากขึ้น ซึ่งเจ้า Data Lakes เป็นสถาปัตยกรรมที่ทันสมัยกว่า เก็บข้อมูลไว้ที่ศูนย์กลาง โดยไม่ต้องกำหนดโครงสร้างของข้อมูล รองรับข้อมูลได้หลากหลาย มีความสามารถในการปรับขนาดได้ มีความทนทานสูง และต้นทุนต่ำกว่า เหมาะกับการนำไปทำ Machine Learning มากกว่า
.
✨ ประโยชน์
- สามารถจัดเก็บข้อมูลแบบไม่มี Schema ได้ เมื่อข้อมูลถูกอ่านระหว่างการประมวลผลจะถูกปรับให้เป็นข้อมูลที่มี Schema ตามที่จำเป็น ซึ่งมันจะช่วยประหยัดเวลาไปเยอะเลยนั่นเอง
- สามารถเข้าถึงข้อมูล จัดเตรียม และวิเคราะห์ข้อมูลได้รวดเร็ว
- มีความยืดหยุ่นสูง และต้นทุนต่ำ
.
💡 มันสำคัญยังไงกันนะ ?
องค์กรที่มีการทำ Data Lakes ทำให้มีการวิเคราะห์ข้อมูลประเภทใหม่ และสามารถเข้าถึงแหล่งข้อมูลใหม่ ๆ มากขึ้น ซึ่งจะช่วยให้เพิ่มประสิทธิภาพในการตัดสินใจทางธุรกิจ ดึงดูดลูกค้า และมีโอกาสเติบโตมากกว่านั่นเอง (อ้างอิงจากผลสำรวจ Aberdeen)
.
💥 อ่านเพิ่มเติมได้ที่ : https://aws.amazon.com/th/big-data/datalakes-and-analytics/what-is-a-data-lake/ ,
https://databricks.com/discover/data-lakes/introduction , https://www.talend.com/resources/what-is-data-lake/ ,
https://s3-ap-southeast-1.amazonaws.com/mktg-apac/Big+Data+Refresh+Q4+Campaign/Aberdeen+Research+-+Angling+for+Insights+in+Today's+Data+Lake.pdf
.
หากใครชอบเนื้อหานี้ ฝากกดไลค์กดแชร์เป็นกำลังใจให้แอดด้วยน้าาาา 😍
.
borntoDev - 🦖 สร้างการเรียนรู้ที่ดีสำหรับสายไอทีในทุกวัน
structured data unstructured data 在 BorntoDev Facebook 的最讚貼文
🔥 "ข้อมูลแบบไหน ควรเก็บรูปแบบใด ?" กับเรื่องราว 108 ปัญหาไม่ว่าจะเป็นการจัดเก็บของมูลของแอปพลิเคชัน จนถึง ระบบขนาดใหญ่
.
ว่าเราจะเลือกเก็บอะไร รูปแบบไหนดี ? ซึ่งในวันนี้แอดมินได้แบ่งออกมาเป็น 2 หัวข้อใหญ่ ๆ นั่นก็คือ Structured Data และ Unstructured Data
.
✅ โดยแบบมีโครงสร้างหรือ Structured นั้นเรามักจะพบได้บ่อยมาก ๆ ทั้งใน Excel, SQL Database ทั่ว ๆ ไป ส่วนแบบไม่มีโครงสร้างพบได้ทั้ง NoSQL หรือ การเก็บข้อมูลประเภทอื่น ๆ นั่นเอง
.
"ทั้งนี้ทีมแอดได้สรุปไว้ให้เรียบร้อย" แน่นอนว่าแต่ละงานอาจจะเหมาะสมกับบางโครงสร้าง ซึ่งในฐานะที่เป็นนักพัฒนาซอฟต์แวร์ เราก็ควรจะเลือกที่ตอบโจทย์กับงานให้มากที่สุดจ้า <3
.
#borntoDev - 🦖 สร้างการเรียนรู้ที่ดีสำหรับสายไอทีในทุกวัน
structured data unstructured data 在 eCloudvalley Facebook 的最佳貼文
#FAQPool #EP4
What is a data lake?
A #data lake is a centralized repository that allows you to store all your structured and unstructured data at any scale. You can store your data as-is, without having to first structure the data, and run different types of analytics—from dashboards and visualizations to big data processing, real-time analytics, and machine learning to guide better decisions.
👉Accelerate Data-driven innovation now: https://www.ecloudvalley.com/solutions/data-solutions/