นักวิจัย Alliance DAO: ความเข้าใจอย่างเรียบง่ายและเจาะลึกเกี่ยวกับแนวคิด MCP เบื้องหลังความนิยมของ DARK-web3资讯-ODAILY

ผู้เขียนต้นฉบับ: โมฮัมเหม็ด เอลเซดี

คำแปลต้นฉบับ: TechFlow

การแนะนำ

เมื่อวานนี้โทเค็น $Dark ที่เกี่ยวข้องกับ AI ของ Solana ได้เปิดตัวบน Binance Alpha แล้ว และมูลค่าตลาดของโทเค็นนี้ก็แตะประมาณ 40 ล้านดอลลาร์สหรัฐแล้ว

ในรายงานล่าสุดของ AI ในด้านคริปโต $Dark มีความเกี่ยวข้องอย่างใกล้ชิดกับ MCP (Model Context Protocol) ซึ่งเป็นพื้นที่ที่บริษัทเทคโนโลยี Web2 เช่น Google กำลังให้ความสนใจและกำลังสำรวจอยู่ในปัจจุบัน

อย่างไรก็ตาม ในปัจจุบันยังมีบทความไม่มากนักที่สามารถอธิบายแนวคิดและผลกระทบเชิงเรื่องราวของ MCP ได้อย่างชัดเจน

ต่อไปนี้เป็นบทความเชิงลึกเกี่ยวกับโปรโตคอล MCP โดยนักวิจัย Alliance DAO Mohamed ElSeidy อธิบายหลักการและตำแหน่งของ MCP ในภาษาที่นิยมมาก ซึ่งอาจช่วยให้เราเข้าใจเรื่องราวล่าสุดได้อย่างรวดเร็ว

TechFlow รวบรวมบทความฉบับเต็ม

ในช่วงหลายปีที่ทำงานอยู่ที่ Alliance ฉันได้เห็นผู้ก่อตั้งจำนวนนับไม่ถ้วนสร้างเครื่องมือเฉพาะทางและการผสานรวมข้อมูลของตัวเองที่ฝังไว้ในเอเจนต์ AI และเวิร์กโฟลว์ของพวกเขา อย่างไรก็ตาม อัลกอริทึม การกำหนดรูปแบบ และชุดข้อมูลเฉพาะเหล่านี้ถูกล็อกไว้ภายใต้การผสานรวมแบบกำหนดเองและแทบไม่มีใครได้ใช้เลย

สิ่งนี้กำลังเปลี่ยนแปลงอย่างรวดเร็วด้วยการถือกำเนิดของ Model Context Protocol (MCP) MCP ถูกกำหนดให้เป็นโปรโตคอลเปิดที่กำหนดมาตรฐานว่าแอปพลิเคชันสื่อสารกับ Large Language Models (LLM) อย่างไร และจัดเตรียมบริบทอย่างไร อุปมาอุปไมยอย่างหนึ่งที่ฉันชอบจริงๆ ก็คือ “สำหรับแอปพลิเคชัน AI นั้น MCP ก็เหมือนกับ USB-C ในด้านฮาร์ดแวร์” เป็นแบบมาตรฐาน เสียบแล้วเล่นได้ อเนกประสงค์ และเปลี่ยนแปลงได้

เหตุใดจึงควรเลือก MCP?

โมเดลภาษาขนาดใหญ่ (เช่น Claude, OpenAI, LLAMA เป็นต้น) มีประสิทธิภาพมาก แต่ก็มีข้อจำกัดด้วยข้อมูลที่สามารถเข้าถึงได้ในปัจจุบัน ซึ่งหมายความว่าพวกเขามักจะมีจุดตัดความรู้และไม่สามารถท่องเว็บได้อย่างอิสระ หรือเข้าถึงไฟล์ส่วนบุคคลหรือเครื่องมือเฉพาะทางของคุณได้โดยตรง เว้นแต่ว่าจะมีรูปแบบการบูรณาการบางอย่าง

โดยเฉพาะอย่างยิ่ง นักพัฒนาต้องเผชิญกับความท้าทายหลักสามประการเมื่อเชื่อมต่อ LLM กับข้อมูลและเครื่องมือภายนอก:

ความซับซ้อนของการบูรณาการ: การสร้างการบูรณาการแบบแยกกันสำหรับแต่ละแพลตฟอร์ม (เช่น Claude, ChatGPT เป็นต้น) ต้องใช้ความพยายามซ้ำซ้อนและการบำรุงรักษาฐานโค้ดหลายชุด
การแบ่งส่วนของเครื่องมือ: ฟังก์ชันการทำงานของเครื่องมือแต่ละอย่าง (เช่น การเข้าถึงไฟล์ การเชื่อมต่อ API เป็นต้น) ต้องมีรหัสการรวมและโมเดลการอนุญาตเฉพาะของตัวเอง
การจัดจำหน่ายที่จำกัด: เครื่องมือที่เป็นกรรมสิทธิ์ถูกจำกัดให้ใช้เฉพาะแพลตฟอร์มเฉพาะ ซึ่งจำกัดการเข้าถึงและผลกระทบ
MCP แก้ไขปัญหาเหล่านี้โดยจัดเตรียมวิธีมาตรฐานสำหรับ LLM ใดๆ เพื่อเข้าถึงเครื่องมือภายนอกและแหล่งข้อมูลอย่างปลอดภัยผ่านทางโปรโตคอลทั่วไป ตอนนี้เราเข้าใจแล้วว่า MCP ทำอะไร มาดูกันว่าผู้คนสร้างอะไรด้วยมันบ้าง
ผู้คนกำลังสร้างอะไรด้วย MCP?
ปัจจุบันระบบนิเวศ MCP กำลังอยู่ในช่วงของการระเบิดของนวัตกรรม นี่คือตัวอย่างล่าสุดบางส่วนที่ฉันพบบน Twitter ของนักพัฒนาที่กำลังอวดผลงานของพวกเขา:
สตอรี่บอร์ดที่ขับเคลื่อนโดย AI: การผสานรวม MCP ที่ทำให้ Claude สามารถควบคุม ChatGPT-4 o เพื่อสร้างสตอรี่บอร์ดที่สมบูรณ์ในสไตล์ Ghibli โดยอัตโนมัติโดยไม่ต้องมีการแทรกแซงจากมนุษย์ใดๆ
การรวมเสียงของ ElevenLabs: เซิร์ฟเวอร์ MCP ที่ให้ Claude และ Cursor สามารถเข้าถึงแพลตฟอร์ม AI Audio ทั้งหมดได้ผ่านคำแนะนำข้อความธรรมดา การผสานรวมมีประสิทธิภาพเพียงพอที่จะสร้างตัวแทนเสียงที่สามารถโทรออกได้ สิ่งนี้แสดงให้เห็นว่า MCP สามารถขยายเครื่องมือ AI ที่มีอยู่ในปัจจุบันไปสู่โดเมนเสียงได้อย่างไร
การจัดการอัตโนมัติของเบราว์เซอร์ด้วย Playwright: เซิร์ฟเวอร์ MCP ที่ทำให้ตัวแทน AI สามารถควบคุมเว็บเบราว์เซอร์ได้โดยไม่ต้องใช้ภาพหน้าจอหรือโมเดลภาพ สิ่งนี้สร้างความเป็นไปได้ใหม่ๆ ให้กับการทำงานอัตโนมัติบนเว็บ โดยช่วยให้ LLM สามารถควบคุมการโต้ตอบของเบราว์เซอร์ได้โดยตรงในรูปแบบมาตรฐาน
การบูรณาการ WhatsApp ส่วนบุคคล: เซิร์ฟเวอร์ที่เชื่อมต่อกับบัญชี WhatsApp ส่วนบุคคล ช่วยให้ Claude ค้นหาข้อความและผู้ติดต่อ และส่งข้อความใหม่ได้
เครื่องมือค้นหา Airbnb: เครื่องมือค้นหาอพาร์ทเมนท์ Airbnb ที่แสดงให้เห็นถึงความเรียบง่ายของ MCP และความสามารถในการสร้างแอปพลิเคชันที่มีประโยชน์ที่โต้ตอบกับบริการเว็บ
ระบบควบคุมหุ่นยนต์: ตัวควบคุม MCP สำหรับหุ่นยนต์ ตัวอย่างนี้เชื่อมช่องว่างระหว่าง LLM และฮาร์ดแวร์ทางกายภาพ แสดงให้เห็นถึงศักยภาพของ MCP ในแอปพลิเคชัน IoT และหุ่นยนต์
Google Maps และการค้นหาในท้องถิ่น: เชื่อมต่อ Claude เข้ากับข้อมูล Google Maps เพื่อสร้างระบบที่สามารถค้นหาและแนะนำธุรกิจในท้องถิ่น เช่น ร้านกาแฟ ส่วนขยายนี้จะช่วยให้ผู้ช่วย AI สามารถให้บริการตามตำแหน่งที่ตั้งได้
การรวมบล็อคเชน: โครงการ Lyra MCP นำฟังก์ชัน MCP มาสู่ StoryProtocol และแพลตฟอร์ม web3 อื่นๆ สิ่งนี้ช่วยให้สามารถโต้ตอบกับข้อมูลบล็อคเชนและสัญญาอัจฉริยะได้ ซึ่งเปิดโอกาสใหม่ๆ ให้กับแอปพลิเคชันแบบกระจายอำนาจที่ได้รับการปรับปรุงด้วย AI

สิ่งที่โดดเด่นเป็นพิเศษเกี่ยวกับตัวอย่างเหล่านี้คือความหลากหลายของมัน ในช่วงเวลาสั้นๆ นับตั้งแต่ MCP เปิดตัว นักพัฒนาได้สร้างการบูรณาการที่ครอบคลุมการผลิตสื่อสร้างสรรค์ แพลตฟอร์มการสื่อสาร การควบคุมฮาร์ดแวร์ บริการระบุตำแหน่ง และเทคโนโลยีบล็อคเชน แอปพลิเคชันต่างๆ เหล่านี้ปฏิบัติตามโปรโตคอลมาตรฐานเดียวกัน แสดงให้เห็นถึงความหลากหลายของ MCP และศักยภาพในการเป็นมาตรฐานสากลสำหรับการรวมเครื่องมือ AI

หากคุณต้องการดูคอลเลกชันเซิร์ฟเวอร์ MCP แบบครบถ้วน คุณสามารถไปที่คลังเก็บเซิร์ฟเวอร์ MCP อย่างเป็นทางการได้บน GitHub โปรดอ่านข้อจำกัดความรับผิดชอบอย่างละเอียดก่อนใช้เซิร์ฟเวอร์ MCP ใดๆ และควรใช้ความระมัดระวังเกี่ยวกับสิ่งที่คุณรันและอนุญาต

คำสัญญาและการโฆษณา

เช่นเดียวกับเทคโนโลยีใหม่ๆ ใดๆ ก็ตาม สมควรที่จะตั้งคำถามว่า MCP เป็นนวัตกรรมเชิงปฏิรูปที่แท้จริงหรือเป็นเพียงเครื่องมือที่ได้รับการประโคมข่าวเกินจริงและจะค่อยๆ หายไปในที่สุด?

หลังจากสังเกตสตาร์ทอัพจำนวนมาก ฉันเชื่อว่า MCP ถือเป็นจุดเปลี่ยนที่แท้จริงในการพัฒนา AI ต่างจากกระแสอื่นๆ มากมายที่สัญญาว่าจะปฏิวัติ แต่ให้ผลลัพธ์เพียงการเปลี่ยนแปลงเล็กน้อยเท่านั้น MCP เป็นการเสริมประสิทธิภาพการทำงานที่แก้ไขปัญหาโครงสร้างพื้นฐานที่ทำให้ระบบนิเวศทั้งหมดชะงักงัน

สิ่งที่พิเศษคือมันไม่ได้พยายามที่จะแทนที่หรือแข่งขันกับโมเดล AI ที่มีอยู่ แต่กลับทำให้โมเดลเหล่านั้นมีประโยชน์มากขึ้นโดยเชื่อมต่อกับเครื่องมือภายนอกและข้อมูลที่ต้องการ

อย่างไรก็ตาม ข้อกังวลที่ถูกต้องเกี่ยวกับความปลอดภัยและมาตรฐานยังคงมีอยู่ เช่นเดียวกับโปรโตคอลอื่นๆ ในช่วงเริ่มต้น เราอาจเห็นปัญหาในการเติบโตเมื่อชุมชนสำรวจแนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับการตรวจสอบ การอนุญาต การรับรองความถูกต้อง และการตรวจสอบความถูกต้องของเซิร์ฟเวอร์ นักพัฒนาต้องเชื่อถือความสามารถของเซิร์ฟเวอร์ MCP เหล่านี้ และไม่ควรเชื่อถือโดยไม่ไตร่ตรอง โดยเฉพาะอย่างยิ่งเมื่อเซิร์ฟเวอร์เหล่านี้มีการใช้งานเพิ่มมากขึ้น บทความนี้จะกล่าวถึงช่องโหว่ล่าสุดบางส่วนที่ถูกเปิดเผยโดยการใช้เซิร์ฟเวอร์ MCP ที่ไม่ผ่านการตรวจสอบอย่างรอบคอบ แม้ว่าจะรันภายในเครื่องก็ตาม

อนาคตของ AI คือการสร้างบริบท

แอปพลิเคชัน AI ที่ทรงพลังที่สุดจะไม่ใช่รูปแบบแบบสแตนด์อโลนอีกต่อไป แต่เป็นระบบนิเวศของความสามารถเฉพาะทางที่เชื่อมต่อผ่านโปรโตคอลมาตรฐานเช่น MCP สำหรับบริษัทสตาร์ทอัพ MCP ถือเป็นโอกาสในการสร้างส่วนประกอบเฉพาะทางที่เหมาะกับระบบนิเวศที่กำลังเติบโตเหล่านี้ นี่เป็นโอกาสที่จะใช้ประโยชน์จากความรู้และความสามารถเฉพาะตัวของคุณ พร้อมทั้งรับประโยชน์จากการลงทุนจำนวนมากในโมเดลพื้นฐาน

เมื่อมองไปข้างหน้า เราคาดหวังว่า MCP จะกลายเป็นส่วนประกอบพื้นฐานของโครงสร้างพื้นฐาน AI เช่นเดียวกับที่ HTTP เป็นของเว็บ เมื่อโปรโตคอลมีความสมบูรณ์มากขึ้นและมีการนำไปใช้มากขึ้น เราจะเห็นตลาดสำหรับเซิร์ฟเวอร์ MCP เฉพาะทางเกิดขึ้น ซึ่งจะทำให้ระบบ AI สามารถใช้ประโยชน์จากความสามารถหรือแหล่งข้อมูลเกือบทุกประเภทที่จินตนาการได้

สตาร์ทอัพของคุณเคยลองนำ MCP มาใช้หรือยัง? ฉันอยากจะได้ยินเกี่ยวกับประสบการณ์ของคุณในความคิดเห็น หากคุณสร้างบางสิ่งที่น่าสนใจในพื้นที่นี้ โปรดติดต่อเราที่ @alliancedao และสมัครได้เลย

ภาคผนวก

สำหรับผู้ที่สนใจจะเข้าใจถึงวิธีการทำงานของ MCP จริงๆ ภาคผนวกต่อไปนี้จะให้ข้อมูลรายละเอียดทางเทคนิคของสถาปัตยกรรม เวิร์กโฟลว์ และการใช้งาน

เบื้องหลัง MCP

MCP ทำสิ่งเดียวกันนี้กับกรอบงาน AI ในลักษณะเดียวกับที่ HTTP กำหนดมาตรฐานการเข้าถึงแหล่งข้อมูลและข้อมูลภายนอก โดยสร้างภาษากลางที่ช่วยให้ระบบ AI ต่างๆ สื่อสารกันได้อย่างราบรื่น มาลองดูกันว่าทำอย่างไร

สถาปัตยกรรมและกระบวนการ MCP

นักวิจัย Alliance DAO: ความเข้าใจอย่างเรียบง่ายและเจาะลึกเกี่ยวกับแนวคิด MCP เบื้องหลังความนิยมของ DARK

สถาปัตยกรรมหลักปฏิบัติตามรูปแบบไคลเอนต์-เซิร์ฟเวอร์โดยมีส่วนประกอบหลักสี่ประการทำงานร่วมกัน:

โฮสต์ MCP: รวมถึงแอปพลิเคชัน AI บนเดสก์ท็อป เช่น Claude หรือ ChatGPT, IDE เช่น cursorAI หรือ VSCode หรือเครื่องมือ AI อื่นๆ ที่ต้องเข้าถึงข้อมูลและฟังก์ชันภายนอก
ไคลเอ็นต์ MCP: โปรเซสเซอร์โปรโตคอลที่ฝังอยู่ในคอมพิวเตอร์โฮสต์ที่รักษาการเชื่อมต่อแบบหนึ่งต่อหนึ่งกับเซิร์ฟเวอร์ MCP
เซิร์ฟเวอร์ MCP: โปรแกรมน้ำหนักเบาที่เปิดเผยฟังก์ชันเฉพาะผ่านทางโปรโตคอลมาตรฐาน
แหล่งที่มาของข้อมูล: ได้แก่ ไฟล์ ฐานข้อมูล API และบริการต่างๆ ที่เซิร์ฟเวอร์ MCP สามารถเข้าถึงได้อย่างปลอดภัย

ตอนนี้เราได้พูดคุยเกี่ยวกับส่วนประกอบเหล่านี้แล้ว มาดูกันว่าส่วนประกอบเหล่านี้โต้ตอบกันอย่างไรในเวิร์กโฟลว์ทั่วไป:

การโต้ตอบของผู้ใช้: ผู้ใช้ถามคำถามหรือส่งคำขอในโฮสต์ MCP (เช่น Claude Desktop)
การวิเคราะห์ LLM: LLM วิเคราะห์คำขอและกำหนดว่าจำเป็นต้องมีข้อมูลภายนอกหรือเครื่องมือเพื่อให้การตอบสนองที่สมบูรณ์
การค้นหาเครื่องมือ: ไคลเอนต์ MCP จะสอบถามเซิร์ฟเวอร์ MCP ที่เชื่อมต่อเพื่อค้นหาเครื่องมือที่มีอยู่
การเลือกเครื่องมือ: LLM ตัดสินใจว่าจะใช้เครื่องมือใดตามคำขอและฟังก์ชันที่มีอยู่
คำขออนุญาต: โฮสต์ขออนุญาตจากผู้ใช้ในการดำเนินการเครื่องมือที่เลือกเพื่อให้แน่ใจถึงความโปร่งใสและปลอดภัย
การดำเนินการเครื่องมือ: หลังจากอนุมัติ ไคลเอนต์ MCP จะส่งคำขอไปยังเซิร์ฟเวอร์ MCP ที่เหมาะสม ซึ่งใช้การเข้าถึงแหล่งข้อมูลเฉพาะทางเพื่อดำเนินการ
การประมวลผลผลลัพธ์: เซิร์ฟเวอร์ส่งคืนผลลัพธ์ไปยังไคลเอนต์ซึ่งจะจัดรูปแบบเพื่อให้ LLM ใช้
การสร้างการตอบสนอง: LLM บูรณาการข้อมูลภายนอกเป็นการตอบสนองที่ครอบคลุม
การนำเสนอของผู้ใช้: ในที่สุดคำตอบจะถูกนำเสนอให้กับผู้ใช้ปลายทาง

พลังของสถาปัตยกรรมนี้คือเซิร์ฟเวอร์ MCP แต่ละเครื่องจะเชี่ยวชาญในพื้นที่เฉพาะแต่ใช้โปรโตคอลการสื่อสารมาตรฐาน ด้วยวิธีนี้ นักพัฒนาไม่จำเป็นต้องสร้างการบูรณาการใหม่สำหรับแต่ละแพลตฟอร์ม แต่สามารถพัฒนาเครื่องมือได้เพียงครั้งเดียวเพื่อรองรับระบบนิเวศ AI ทั้งหมด

วิธีสร้างเซิร์ฟเวอร์ MCP ตัวแรกของคุณ

ตอนนี้เรามาดูวิธีการใช้เซิร์ฟเวอร์ MCP ง่ายๆ ด้วยโค้ดไม่กี่บรรทัดโดยใช้ MCP SDK กัน

ในตัวอย่างง่ายๆ นี้ เราต้องการขยายขีดความสามารถของ Claude Desktop เพื่อให้สามารถตอบคำถามเช่น ร้านกาแฟใดใกล้กับ Central Park โดยใช้ข้อมูลจาก Google Maps คุณสามารถขยายฟังก์ชันนี้เพื่อรับรีวิวหรือให้คะแนนได้อย่างง่ายดาย แต่ในขณะนี้ เรากำลังมุ่งเน้นไปที่เครื่องมือ MCP ชื่อ find_nearby_places ซึ่งจะช่วยให้ Claude ดึงข้อมูลนี้โดยตรงจาก Google Maps และนำเสนอผลลัพธ์ในรูปแบบการสนทนาได้

อย่างที่คุณเห็นโค้ดนี้เรียบง่ายมาก ขั้นแรกจะแปลงคำค้นหาเป็นการค้นหา Google Maps API จากนั้นจึงส่งคืนผลลัพธ์อันดับต้นๆ ในรูปแบบที่มีโครงสร้าง วิธีนี้ข้อมูลจะถูกส่งกลับไปยัง LLM เพื่อการตัดสินใจเพิ่มเติม

ตอนนี้เราต้องทำให้เครื่องมือนี้เป็นที่รู้จักแก่ Claude Desktop ดังนั้นเราจึงลงทะเบียนในไฟล์กำหนดค่าดังนี้:

เส้นทาง macOS: ~/Library/Application Support/Claude/claude_desktop_config.json เส้นทาง Windows: %APPDATA%\Claude\claude_desktop_config.json

เท่านี้ก็เสร็จเรียบร้อยแล้ว! ตอนนี้คุณได้ขยายการทำงานของ Claude เพื่อค้นหาตำแหน่งจาก Google Maps แบบเรียลไทม์สำเร็จแล้ว