Microsoft Fabric Terminology ที่ควรรู้

Microsoft Fabric เป็นแพลตฟอร์มที่มีประสิทธิภาพสำหรับการรวมข้อมูล, การวิเคราะห์, และการเรียนรู้ของเครื่อง (Machine Learning) เพื่อช่วยให้คุณสามารถนำทางในระบบนิเวศของ Microsoft Fabric ได้, การเข้าใจคำศัพท์ที่ใช้ภายในจึงเป็นสิ่งสำคัญ ที่นี่เราจะแยกคำศัพท์หลักและแนวคิดที่เกี่ยวข้องกับ Microsoft Fabric ออกมาให้เข้าใจได้ง่ายขึ้น
ความเข้าใจใน Microsoft Fabric Terminology
คำศัพท์ทั่วไป
- Capacity
Capacity คือชุดทรัพยากรที่มีให้ใช้ในช่วงเวลาหนึ่ง โดยกำหนดความสามารถของทรัพยากรในการทำกิจกรรมหรือสร้างผลลัพธ์ต่างๆ สิ่งของที่ใช้ทรัพยากรจะใช้ Capacity ในช่วงเวลาหนึ่ง Microsoft Fabric ให้บริการ Capacity ผ่าน Fabric SKU และ Trials. - Experience
Experience คือการรวมชุดความสามารถที่มุ่งเน้นไปที่ฟังก์ชันเฉพาะ เช่น Fabric Data Warehouse, Fabric Data Engineering, Fabric Data Science, Real-Time Intelligence, Data Factory, และ Power BI. - Item
Item คือชุดความสามารถภายในแต่ละ Experience ผู้ใช้สามารถสร้าง แก้ไข และลบ Item ได้ โดยแต่ละประเภทของ Item จะให้ความสามารถที่แตกต่างกัน ตัวอย่างเช่น ใน Fabric Data Engineering ประกอบไปด้วย Lakehouse, Notebook, และ Spark job definition. - Tenant
Tenant คือการใช้งาน Fabric แบบเดียวสำหรับองค์กรหนึ่ง โดยเชื่อมโยงกับ Microsoft Entra ID. - Workspace
Workspace คือการรวมของ Item ที่นำฟังก์ชันต่างๆ มารวมไว้ในสภาพแวดล้อมเดียวที่ออกแบบมาเพื่อการทำงานร่วมกัน โดยทำหน้าที่เป็นตัวเก็บที่ใช้ Capacity สำหรับการดำเนินงานและมีการควบคุมการเข้าถึง Item ภายในนั้น ตัวอย่างเช่น ใน Workspace ผู้ใช้สามารถสร้างรายงาน, โน้ตบุ๊ก, และโมเดลที่มีความหมาย.
Fabric Data Engineering
- Lakehouse
Lakehouse คือการรวมของไฟล์, โฟลเดอร์, และตารางที่เป็นฐานข้อมูลบน Data Lake ที่ใช้โดย Apache Spark engine และ SQL engine สำหรับการประมวลผลข้อมูลขนาดใหญ่ Lakehouse ยังมีความสามารถเพิ่มเติมสำหรับ ACID transactions เมื่อใช้ Delta formatted tables แบบโอเพ่นซอร์ส Lakehouse จะถูกเก็บภายในโฟลเดอร์ Workspace เฉพาะใน Microsoft OneLake โดยมีไฟล์ในรูปแบบต่างๆ ทั้งแบบมีโครงสร้างและไม่มีโครงสร้างที่จัดระเบียบในโฟลเดอร์และซับโฟลเดอร์ - Notebook
Fabric Notebook คือเครื่องมือโค้ดดิ้งแบบอินเตอร์แอคทีฟที่รองรับหลายภาษา ซึ่งรวมถึงการเขียนโค้ดและการทำ Markdown, การรันและการติดตามผล Spark job, การดูผลลัพธ์ และการทำงานร่วมกับทีม เป็นเครื่องมือที่ช่วยให้ Data Engineer และ Data Scientist สามารถสำรวจและประมวลผลข้อมูล รวมถึงสร้างการทดลอง Machine Learning ด้วยทั้งโค้ดและประสบการณ์แบบ Low-code - Spark application
Apache Spark application คือโปรแกรมที่ผู้ใช้เขียนโดยใช้ภาษาของ API ของ Spark เช่น Scala, Python, Spark SQL หรือ Java หรือภาษาที่เพิ่มโดย Microsoft เช่น .NET กับ C# หรือ F# เมื่อโปรแกรมทำงาน มันจะแบ่งออกเป็นหนึ่งหรือหลาย Spark jobs ที่ทำงานแบบขนานเพื่อประมวลผลข้อมูลให้เร็วขึ้น - Apache Spark job
Spark job คือส่วนหนึ่งของ Spark application ที่ทำงานพร้อมกันกับ job อื่นๆ ในแอปพลิเคชันเดียวกัน โดยหนึ่ง job จะประกอบด้วยหลายๆ task - Apache Spark job definition
Spark job definition คือชุดของพารามิเตอร์ที่ผู้ใช้กำหนด เพื่อระบุวิธีการที่ Spark application จะทำงาน ซึ่งช่วยให้สามารถส่ง batch หรือ streaming jobs ไปยัง Spark cluster ได้ - V-order
V-order คือการปรับปรุงการเขียนในรูปแบบไฟล์ Parquet ที่ช่วยให้การอ่านข้อมูลรวดเร็วขึ้นและมีประสิทธิภาพด้านต้นทุนและประสิทธิภาพการทำงานที่ดีกว่า โดยทั้ง Fabric engines จะเขียนไฟล์ Parquet ที่เป็น V-ordered โดยค่าเริ่มต้น
Data Factory
- Connector
Data Factory มีชุดของ connectors ที่มีความหลากหลาย ช่วยให้คุณสามารถเชื่อมต่อกับแหล่งข้อมูลประเภทต่างๆ ได้ เมื่อเชื่อมต่อแล้ว คุณสามารถแปลงข้อมูลได้. - Data pipeline
ใน Data Factory, data pipeline ใช้สำหรับการจัดการการเคลื่อนย้ายและการแปลงข้อมูล Pipelines เหล่านี้แตกต่างจาก deployment pipelines ใน Fabric. - Dataflow Gen2
Dataflows มอบอินเตอร์เฟซแบบ Low-code สำหรับการดึงข้อมูลจากแหล่งข้อมูลหลายร้อยแหล่งและแปลงข้อมูลของคุณ Dataflows ใน Fabric เรียกว่า Dataflow Gen2. Dataflow Gen1 มีอยู่ใน Power BI. Dataflow Gen2 มีความสามารถเพิ่มเติมเมื่อเทียบกับ Dataflows ใน Azure Data Factory หรือ Power BI. คุณไม่สามารถอัปเกรดจาก Gen1 เป็น Gen2.
Fabric Data Science
- Data Wrangler
Data Wrangler คือเครื่องมือแบบโน้ตบุ๊กที่มอบประสบการณ์ที่สมจริงในการทำการวิเคราะห์ข้อมูลเชิงสำรวจ ฟีเจอร์นี้รวมการแสดงข้อมูลในรูปแบบตารางเข้ากับสถิติสรุปแบบพลศาสตร์และชุดการทำความสะอาดข้อมูลที่ใช้บ่อยทั้งหมด ซึ่งสามารถเข้าถึงได้ด้วยไอคอนที่เลือกไว้ การทำงานแต่ละอย่างจะสร้างโค้ดที่สามารถบันทึกกลับไปยังโน้ตบุ๊กเป็นสคริปต์ที่สามารถนำกลับมาใช้ใหม่ได้. - Experiment
การทดลองทาง Machine Learning คือหน่วยหลักของการจัดระเบียบและควบคุมการทำงานทั้งหมดที่เกี่ยวข้องกับการทดลองทาง Machine Learning. - Model
แบบจำลองทาง Machine Learning คือไฟล์ที่ผ่านการฝึกอบรมเพื่อจดจำลักษณะของรูปแบบบางประเภท คุณฝึกอบรมแบบจำลองบนชุดข้อมูลและให้มันใช้อัลกอริธึมในการวิเคราะห์และเรียนรู้จากชุดข้อมูลนั้น. - Run
Run คือการดำเนินการของโค้ดแบบจำลองหนึ่งครั้ง ใน MLflow การติดตามจะขึ้นอยู่กับการทดลองและการทำงาน.
Fabric Data Warehouse
- SQL analytics endpoint
การทดลองทาง Machine Learning คือหน่วยหลักของการจัดระเบียบและควบคุมการทำงานทั้งหมดที่เกี่ยวข้องกับการทดลองทาง Machine Learning. - Fabric Data Warehouse
Fabric Data Warehouse ทำงานเหมือนกับคลังข้อมูลแบบดั้งเดิมและรองรับความสามารถทาง T-SQL ที่สมบูรณ์แบบตามที่คุณคาดหวังจากคลังข้อมูลระดับองค์กร.
Real-Time Intelligence
- Activator
Activator คือเครื่องมือแบบ No-code, Low-code ที่ช่วยให้คุณสร้างการแจ้งเตือน, การกระตุ้น, และการกระทำกับข้อมูลของคุณ Activator ใช้ในการสร้างการแจ้งเตือนบนข้อมูลสตรีมของคุณ. - Eventhouse
Eventhouses มอบทางออกสำหรับการจัดการและวิเคราะห์ข้อมูลปริมาณมาก โดยเฉพาะในกรณีที่ต้องการการวิเคราะห์และการสำรวจข้อมูลแบบเรียลไทม์ พวกมันถูกออกแบบมาเพื่อจัดการข้อมูลสตรีมแบบเรียลไทม์ได้อย่างมีประสิทธิภาพ ซึ่งช่วยให้องค์กรสามารถดึงข้อมูล, ประมวลผล, และวิเคราะห์ข้อมูลในเกือบเรียลไทม์ได้ Workspace เดียวสามารถเก็บหลาย Eventhouses ได้, ในขณะที่แต่ละ Eventhouse สามารถเก็บหลาย KQL databases และฐานข้อมูลแต่ละตัวสามารถเก็บหลายตารางได้. - Eventstream
ฟีเจอร์ eventstreams ของ Microsoft Fabric มอบสถานที่กลางในแพลตฟอร์ม Fabric สำหรับการจับข้อมูลสตรีม, การแปลง, และการส่งต่อข้อมูลเรียลไทม์ไปยังจุดหมายปลายทางด้วยประสบการณ์แบบ No-code. Eventstream ประกอบด้วยแหล่งข้อมูลสตรีมต่างๆ, จุดหมายปลายทางในการดึงข้อมูล, และตัวประมวลผลเหตุการณ์เมื่อมีการแปลงข้อมูล. - KQL Database
KQL Database เก็บข้อมูลในรูปแบบที่สามารถใช้คำสั่ง KQL query ได้ KQL databases คือ item ภายใต้ Eventhouse. - KQL Queryset
KQL Queryset คือ item ที่ใช้ในการรันคำถาม, ดูผลลัพธ์, และจัดการผลลัพธ์คำถามจากฐานข้อมูล Data Explorer ของคุณ. Queryset รวมถึงฐานข้อมูลและตาราง, คำถามต่างๆ และผลลัพธ์. KQL Queryset ช่วยให้คุณบันทึกคำถามเพื่อใช้ในอนาคต, หรือส่งออกและแชร์คำถามกับผู้อื่น.
Real-Time hub
- Real-Time hub
Real-Time hub คือสถานที่เดียวสำหรับข้อมูลที่กำลังเคลื่อนไหวทั่วทั้งองค์กรของคุณ Tenant ของ Microsoft Fabric ทุกตัวจะถูกตั้งค่าให้มี Real-Time hub อัตโนมัติ.
OneLake
- Shortcut
Shortcuts คือการอ้างอิงที่ฝังใน OneLake ที่ชี้ไปยังตำแหน่งที่เก็บไฟล์อื่นๆ พวกมันช่วยให้คุณเชื่อมต่อกับข้อมูลที่มีอยู่โดยไม่ต้องทำการคัดลอกข้อมูลโดยตรง.
บทสรุป
การเข้าใจ Microsoft Fabric Terminology เป็นสิ่งสำคัญในการนำทางและใช้แพลตฟอร์มได้อย่างมีประสิทธิภาพ ไม่ว่าคุณจะทำงานกับ data pipelines, การสร้างโมเดลทาง Machine Learning, หรือการทำงานร่วมกับทีมในการทำโปรเจ็กต์ที่ขับเคลื่อนด้วยข้อมูล คำศัพท์เหล่านี้จะช่วยให้คุณสื่อสารและดำเนินการได้อย่างมีประสิทธิภาพในระบบนิเวศของ Microsoft Fabric.
สนใจผลิตภัณฑ์และบริการของ Microsoft หรือไม่ ส่งข้อความถึงเราที่นี่
สำรวจเครื่องมือดิจิทัลของเรา
หากคุณสนใจในการนำระบบจัดการความรู้มาใช้ในองค์กรของคุณ ติดต่อ SeedKM เพื่อขอข้อมูลเพิ่มเติมเกี่ยวกับระบบจัดการความรู้ภายในองค์กร หรือสำรวจผลิตภัณฑ์อื่นๆ เช่น Jarviz สำหรับการบันทึกเวลาทำงานออนไลน์, OPTIMISTIC สำหรับการจัดการบุคลากร HRM-Payroll, Veracity สำหรับการเซ็นเอกสารดิจิทัล, และ CloudAccount สำหรับการบัญชีออนไลน์
อ่านบทความเพิ่มเติมเกี่ยวกับระบบจัดการความรู้และเครื่องมือการจัดการอื่นๆ ได้ที่ Fusionsol Blog, IP Phone Blog, Chat Framework Blog, และ OpenAI Blog.
Majorana 1 chip: ชิปควอนตัมจาก Microsoft
ถ้าอยากติดตามข่าวเทคโนโลยีและข่าว AI ที่กำลังเป็นกระแสทุกวัน ลองเข้าไปดูที่ เว็บไซต์นี้ มีอัปเดตใหม่ๆ ให้ตามทุกวันเลย!
การพัฒนา Modern AI Chatbot ที่ทันสมัย: มากกว่าการตอบคำถามพื้นฐาน
Related Articles
- Microsoft Fabric: การปฏิรูปการจัดการข้อมูลสำหรับองค์กร
- Microsoft Fabric Pricing: สิ่งที่ธุรกิจต้องรู้
- Cloud DLP: Securing Your Data in the Digital Landscape
- The Power of Interactive Power BI Dashboards
- Beyond the Basics: Advanced Copilot Techniques for Pros
- Data Warehouse Core Concepts: Understanding ETL/ELT, OLAP, and Data Marts
Frequently Asked Questions (FAQ)
Microsoft Fabric คืออะไร?
Microsoft Fabric เป็นแพลตฟอร์มวิเคราะห์ข้อมูลแบบครบวงจรที่รวมเอาข้อมูลจากแหล่งต่าง ๆ มาประมวลผล วิเคราะห์ และสร้างแดชบอร์ดได้ภายในเครื่องมือเดียว รองรับการทำงานของทีมข้อมูล นักวิเคราะห์ และผู้ใช้งานทางธุรกิจ
Microsoft Fabric ต่างจาก Power BI อย่างไร?
Power BI เป็นส่วนหนึ่งของ Microsoft Fabric โดย Fabric มีขอบเขตกว้างกว่า รวมเครื่องมือด้านการจัดการข้อมูล (Data Engineering, Data Factory, Data Science) และใช้ OneLake เป็นที่เก็บข้อมูลกลางร่วมกัน
OneLake ใน Microsoft Fabric คืออะไร?
OneLake คือ Data Lake ส่วนกลางที่เป็นศูนย์รวมของข้อมูลทั้งหมดใน Fabric เพื่อให้สามารถแชร์ข้อมูลได้ระหว่างทีมต่าง ๆ โดยไม่ต้องคัดลอกข้อมูลซ้ำ
ต้องใช้ทักษะเขียนโค้ดเพื่อใช้งาน Microsoft Fabric หรือไม่?
ไม่จำเป็นเสมอไป ผู้ใช้งานสามารถเริ่มต้นจาก Power BI หรือใช้เครื่องมือแบบลากวาง (no-code/low-code) ได้ แต่สำหรับงานด้าน Data Engineering หรือ Data Science อาจต้องใช้ภาษา SQL หรือ Python
Microsoft Fabric เหมาะกับใคร?
เหมาะสำหรับองค์กรที่ต้องการวิเคราะห์ข้อมูลจากหลายแหล่งในที่เดียว โดยเฉพาะทีมงานที่เกี่ยวข้องกับข้อมูล เช่น Data Engineer, Data Scientist, นักวิเคราะห์, และฝ่ายธุรกิจที่ต้องการแดชบอร์ดหรือรายงานที่ปรับแต่งได้