Microsoft Power Query All Connections
Microsoft Power Query
Microsoft Power Query คือเครื่องมือทำ Data Automation ทำงานด้าน ETL (Extract Transform Load) ข้อมูล ช่วยนำข้อมูลจากแหล่งข้อมูลจากหลาย ๆ Source มาทำการปรับแต่งข้อมูล ให้ตรงกับข้อมูลที่เราต้องการวิเคราะห์ข้อมูล อย่างอัตโนมัติด้วยเพื่อลดการทำงานซ้ำ ๆ ด้านข้อมูลลง มีความสามารถด้าน AI ด้วย โดยจะสามารถใช้ได้ทั้ง Microsoft Excel, Power BI และ SQL Server Integration Service
ดูเพิ่มเติมได้ที่บทความ Power Query คืออะไร
ในบทความนี้เรามาเรียนรู้กันว่า Power Query สามารถทำการเชื่อมโยงกับ Data Source อะไรได้บ้าง มีอะไรน่าสนใจบ้าง มีข้อมูลจากแหล่งใดที่เราสามารถนำมา ETL ด้วย Power Query ได้บ้าง ใช้ได้ทั้ง Excel และ Power BI
และหากเข้าใจเรื่องกระบวนการทำงานของ Power Query ดูได้จากบทความ Power Query ทำงานอย่างไร จะได้เข้าใจกระบวนการทำงานของ Power Query มากยิ่งขึ้น
Power Query ใช้ได้ทั้ง Excel, Power BI และ SQL Server Integration Service (SSIS)
โดยใน Excel เริ่มมี Power Query ตั้งแต่ Version 2013 (มาในรูปแบบ Add-Ins) และใน 2016 แต่ก็จะมีคำสั่งหลัก ๆ บางคำสั่งอาจจะต้องเขียนภาษา M เอง
โดยใครที่สนใจการเขียนโปรแกรมด้าน Business Intelligence ดูเพิ่มเติมในบทความ เก่งโค้ดงาน Business Intelligence ตอนที่ 1 ตอนที่ 2 ตอนที่ 3 ตอนที่ 4 ตอนที่ 5 ตอนที่ 6 ตอนที่ 7 ตอนที่ 8
Connectors ใน Power Query
Power Query เชื่อมโยงไปยังอะไรได้บ้าง สามารถแยกเป็นกลุ่ม ๆ ได้ดังนี้
Download Infographic ได้ข้อมูลประเภทไฟล์
ไฟล์ประเภทต่าง ๆ ที่ Power Query สามารถนำเข้ามาใช้งานได้- Excel
- CSV File
- Text File
- JSON
- XML
ข้อมูลประเภทโฟลเดอร์
โฟลเดอร์ที่นำมาใช้งานใน Power Query มีทั้งในรูปแบบ Folder, SharePoint Folder โดยเมื่อนำไฟล์ที่มีโครงสร้างเดียวกันเข้ามาไว้ในโฟลเดอร์ก็จะทำการ Combine Data โดยนำข้อมูลทุกไฟล์ มาต่อกันให้เราอัตโนมัติ ทำให้สะดวกในการดูแลมาก ๆ และไม่ต้องสนใจเรื่องชื่อไฟล์แต่อย่างใด เช่น สามารถนำ Excel หลายชีท หลาย ๆ ไฟล์มารวมกันอัตโนมัติข้อมูลประเภทฐานข้อมูล
Database ที่ Power Query สามารถนำเข้ามาใช้งานได้มีมากมาย โดยในกลุ่มที่เป็น Microsoft Database ซึ่งเป็น Relational Database System (RDBMS) ที่เป็นฐานข้อมูลที่มีโครงสร้าง ก็จะมีอาทิเช่น SQL Server Database, SQL Server Analysis Service และ Microsoft Access ที่จะสามารถ เชื่อมต่อนำข้อมูลจำนวนมาก ๆ มาใช้งานร่วมกันได้
Power Query ยังสามารถเชื่อมโยงไปยัง Database อย่าง Oracle, IBM DB2, PostgreSQL, MySQL และ Sybase ได้อีกด้วย แต่อาจจะต้องลง Data Connection เพิ่มเติม เพื่อเชื่อมโยงข้อมูลเข้ามาใช้ใน Power Query ได้
ข้อมูลประเภท Cloud
ระบบอย่าง SAP HANA, Amazon Redshift และ Teradata ก็เป็นระบบที่ Power Query สามารถเชื่อมโยงนำมาใช้งานได้เช่นกัน
Azure Database
สำหรับ Azure Database อย่าง Azure SQL Database และ Azure SQL Data Warehouse นั้นก็สามารถนำมาใช้งานเพื่อเชื่อมมาใช้งานกับ Power Query เพื่อนำไปวิเคราะห์ทั้งใน Power BI และ Excel ได้อีกด้วย
Power Platform
Power Query ยังสามารถเชื่อมโยงไปยัง Data ที่เป็นของ Power Platform เอง อาทิเช่น Power BI Dataset ที่เรานำข้อมูลขึ้นไปยัง Power BI Service และยังได้ทั้ง Power Platform Dataflows ซึ่งเป็นเสมือน Power Query ที่เป็น Online และ ยังเชื่อมโยงไปยัง Microsoft Dataverse ได้อีกด้วย
Azure
Azure ไม่ว่าจะเป็น Azure Analysis Service, Azure Database for PostgreSQL, Azure Cosmos DB, Azure Data Lake Storage Gen1, Microsoft Azure Blob Storage, Azure Table Storage ก็สามารถนำมาใช้ในการเชื่อมโยงกับ Power Query ได้เช่นกัน
Azure ไม่ว่าจะเป็น Azure Data Lake Storage Gen2, Azure data explorer, Azure Cost Management, Azure HDInsight(HDNS), Azure Time Series Insights ก็สามารถนำมาใช้ในการเชื่อมโยงกับ Power Query เพื่อนำไปวิเคราะห์ข้อมูลได้เช่นกัน
Microsoft Dynamics และ SharePoint
Microsoft Dynamics และ SharePoint ก็เป็นอีกรายการที่ Power BI และ Power Query นำไปเชื่อมโยงได้ ทั้ง Dynamics 365 Business Central, Dynamics 365
Online Service
ระบบที่เราสามารถนำ Power Query เชื่อมโยง (Connect) ไปยัง Service ต่าง ๆ ไม่ว่าจะเป็น Google Analytics, Adobe Analytics, Salesforce, GitHub เป็นต้น ซึ่งมีประโยชน์มาก ๆ ที่เราจะเอาข้อมูลเหล่านี้ มาใช้ประกอบร่วมกับข้อมูล เพื่อดูความเชื่อมโยงต่าง ๆ เช่น วิเคราะห์ยอดขายจาก Salesforce ร่วมกับคนที่เข้าเยี่ยมชมเว็บไซต์จาก Google Analytics เป็นต้น
Social Media
Social Media ก็เปรียบเสมือนถังข้อมูลใหญ่ ๆ ที่เราจะนำไปใช้วิเคราะห์ข้อมูลกันได้ เพื่อ Monitor ข้อมูลว่ามีอะไรเกี่ยวข้องกับองค์กรของเรา แบรนด์ (Brand) ของเราในสังคมออนไลน์ (Social Media) เพื่อใช้เป็นข้อมูลประกอบในการวิเคราะห์ในองค์กรของเราได้
Big Data
Power Query ยังสามารถเข้าไปทำงานกับข้อมูล Big Data ซึ่ง Big Data นั้นไม่สามารถรับมือกับข้อมูลดังกล่าวได้ ทั้งจำนวนที่มากขึ้น หลากหลาย และไม่มีโครงสร้าง (Unstructured) การเพิ่มของข้อมูลนั้น ไม่สามารถของได้ด้วยความเป็น ตาราง (Table) ที่เก็บข้อมูลเป็นแถว (Row) ได้ ดังนั้นเทคโนโลยีของโครงสร้างพื้นฐานนั้น จะต้องสามารถทำงานกับข้อมูลที่มีความหลากหลายได้ และทำการใช้งาน Application จำนวนมาก ๆ ได้ เพื่อให้เข้าถึงข้อมูลจำนวนหลาย ๆ Terabytes ได้ โดยรองรับทั้ง Hadoop, Apache Spark และ Hive ที่สามารถเข้าไปเข้าถึงใช้งานได้ นับเป็นประโยชน์มากเลยทีเดียว โดย Hadoop เป็นเทคโนโลยีทั้งหมดของระบบ ที่ออกแบบมา เพื่อจัดเก็บ ประมวลผล และวิเคราะห์ข้อมูล โดยหลักการสำคัญของเทคโนโลยี Hadoop คือ การทำงานบนหลักการของแยกและกระจายข้อมูลเป็นส่วน ๆ
R และ Python Script
Power Query ยังเปิดให้เราสามารถใช้ Script ในการทำงานเชิง Data Science และ Statistic เพื่อทำงานได้ทั้ง R และ Python อีกด้วย ซึ่งใครที่ทำงานกับ R และ Python จะเห็นประโยชน์จากส่วนนี้มาก ๆ เลยทีเดียว
Website และ API
เรายังสามารถเชื่อมโยงข้อมูลจากเว็บไซต์ต่าง ๆ เข้ามาใช้เช่น Wikipedia, อัตราแลกเปลี่ยนจาก ธนาคารแห่งประเทศไทย หรือ ข้อมูลผู้ติดเชื้อ COVID-19 เป็นต้น หรือจะ Connect ไปยัง Excel Online, Google Sheets ก็ทำได้ และยังมีท่อเชื่อมไปยังแหล่งข้อมูลอื่นๆ ด้วยเทคโนโลยีอย่าง OLEDB และ ODBC (Open Database Connectivity) เพื่อเปิดให้เราเชื่อมไปยังระบบอื่นๆ ที่ไม่มีในรายการแต่อาจจะสามารถสร้างผ่าน OLEDB หรือ ODBC ได้ นับเป็นประโยชน์มาก ๆ
แนะนำหลักสูตรการอบรม
- Power BI Advanced Power Query (2 Days)
- Microsoft Excel Power Query (2 Days)