Spring AI ในทางปฏิบัติ: สร้างแอปพลิเคชัน AI ที่ใช้งานได้จริงด้วย Spring Boot

การปรับปรุงครั้งล่าสุด: 02/13/2026
  • Spring AI นำเสนอความสามารถด้าน AI ที่พกพาได้ มีโครงสร้าง และตรวจสอบได้มาสู่ Spring Boot โดยแยกส่วนผู้ให้บริการ LLM และเวกเตอร์หลักๆ ไว้เบื้องหลัง API Java ที่สอดคล้องกัน
  • หนังสือ "Spring AI in Action" จะแนะนำนักพัฒนา Spring ตั้งแต่การใช้พรอมต์แบบง่ายๆ ไปจนถึง RAG ขั้นสูง เอเจนต์ เครื่องมือ เสียง และการตรวจสอบ โดยใช้รูปแบบที่เป็นรูปธรรมและเน้นตัวอย่าง
  • คุณสมบัติที่มุ่งเน้นองค์กร เช่น Advisors, หน่วยความจำสนทนา, การประเมินโมเดล และการผสานรวม Tanzu Gen AI ทำให้สามารถสร้างระบบ AI ที่เชื่อถือได้และใช้งานได้จริงบน JVM ได้

หนังสือและกรอบแนวคิด Spring AI in Action

หนังสือ Spring AI in Action กำลังกลายเป็นแหล่งอ้างอิงยอดนิยมสำหรับนักพัฒนา Java และ Spring Boot ที่ต้องการนำ AI เชิงสร้างสรรค์สมัยใหม่มาใช้ในโครงการประจำวันโดยไม่ต้องละทิ้งสแต็ก JVM แทนที่จะบังคับให้คุณเข้าไปอยู่ในระบบนิเวศของ Python หรือเครื่องมือที่ซับซ้อน หนังสือเล่มนี้และเฟรมเวิร์กจะทำงานร่วมกันอย่างลงตัว เพื่อให้คุณสามารถเขียนโค้ดด้วย Java หรือ Kotlin ต่อไปได้ ในขณะเดียวกันก็สามารถผสานรวมโมเดลภาษาขนาดใหญ่ (LLM) ที่ทรงพลัง การสร้างข้อความเสริมการค้นหา (RAG) เอเจนต์ เครื่องมือ และคุณสมบัติแบบมัลติโมดอลได้

สิ่งที่ทำให้ระบบนิเวศนี้มีความน่าสนใจอย่างยิ่งคือการผสมผสานระหว่างเฟรมเวิร์กที่พร้อมใช้งานจริง (Spring AI) และคู่มือที่เน้นการใช้งานจริงและตัวอย่างประกอบ (Spring AI in Action โดย Craig Walls) โดยรวมแล้ว สิ่งเหล่านี้แสดงให้เห็นถึงวิธีการเชื่อมต่อโมเดล AI ฐานข้อมูลเวกเตอร์ หน่วยความจำสนทนา และเครื่องมือประเมินผลเข้ากับแอปพลิเคชัน Spring Boot ที่คุ้นเคย โดยใช้ POJO ที่เรียบง่าย การกำหนดค่าอัตโนมัติ และ API ที่สะอาดตาและพกพาได้ ซึ่งซ่อนความซับซ้อนเฉพาะของผู้ให้บริการไว้มากมาย

Spring AI คืออะไร และทำไมจึงสำคัญสำหรับนักพัฒนา Java

Spring AI คือเฟรมเวิร์กสำหรับการพัฒนาแอปพลิเคชันที่ออกแบบมาเพื่อนำหลักการคลาสสิกของ Spring มาใช้ในโลกของการพัฒนา AI ซึ่งได้แก่ ความสามารถในการพกพา สถาปัตยกรรมแบบโมดูลาร์ และการออกแบบที่เน้น POJO (Point of Java Object) หัวใจสำคัญของ Spring AI คือการแก้ปัญหาที่ยากที่สุดในทางปฏิบัติของ AI ระดับองค์กร นั่นคือการเชื่อมต่อองค์กรของคุณ ข้อมูล และ APIs ด้วยความทันสมัย โมเดล AI ในลักษณะที่สามารถบำรุงรักษา ตรวจสอบได้ และพัฒนาต่อยอดได้ง่ายเมื่อเวลาผ่านไป

แทนที่จะผูกมัดคุณไว้กับผู้ให้บริการ LLM เพียงรายเดียว Spring AI จะช่วยลดความซับซ้อนของผู้ให้บริการรายใหญ่ส่วนใหญ่ คุณสามารถสื่อสารกับโมเดลจาก OpenAI ได้ทันทีโดยไม่ต้องตั้งค่าเพิ่มเติม อาซัวร์ โอเพ่นเอไอรวมถึง Anthropic, Amazon Bedrock, Google, MistralAI และแม้แต่โมเดลท้องถิ่นที่ให้บริการผ่าน Ollama รูปแบบการเขียนโปรแกรมเดียวกันนี้รองรับทั้งการตอบสนองแบบซิงโครนัสและแบบสตรีมมิ่ง และคุณยังคงสามารถเข้าถึงความสามารถเฉพาะของผู้ให้บริการได้เมื่อคุณต้องการจริงๆ

อีกหนึ่งเสาหลักสำคัญของ Spring AI คือการสนับสนุนอย่างแข็งแกร่งสำหรับเอาต์พุตที่มีโครงสร้าง แทนที่จะวิเคราะห์ข้อความดิบด้วยมือ คุณสามารถแมปการตอบสนองของโมเดลไปยังคลาสและเรคอร์ด Java ได้โดยตรง เปลี่ยนภาษาธรรมชาติที่ยุ่งเหยิงให้เป็น POJO ที่สะอาดตา ซึ่งเป็นสิ่งสำคัญเมื่อคุณสร้างเอเจนต์ เครื่องมือ หรือเวิร์กโฟลว์ที่ต้องใช้เหตุผลกับข้อมูลที่คาดเดาได้ แทนที่จะเป็นข้อความที่ไม่มีโครงสร้าง

Spring AI ยังผสานรวมอย่างลึกซึ้งกับฐานข้อมูลเวกเตอร์ ทำให้คุณสามารถใช้งานการสร้างภาพเสริมการค้นหา (Retrieval Augmented Generation) ได้โดยไม่ต้องสร้างระบบใหม่ทั้งหมด รองรับผู้ให้บริการฐานข้อมูล เช่น Apache Cassandra, Azure Vector Search, Chroma, Milvus, MongoDB Atlas, Neo4j, การผสานรวม OraclePostgreSQL พร้อมด้วย PGVector, Pinecone, Qdrant, Redis และ Weaviate API สำหรับจัดเก็บเวกเตอร์แบบพกพา และภาษาตัวกรองเมตาเดต้าแบบ SQL ช่วยให้คุณสามารถเปลี่ยนแบ็กเอนด์เวกเตอร์ได้โดยแก้ไขโค้ดเพียงเล็กน้อย

นอกเหนือจากทั้งหมดนั้น Spring AI ยังมาพร้อมกับเครื่องมือสำหรับการตรวจสอบ การประมวลผลเอกสาร การประเมินโมเดล และรูปแบบ AI เชิงสร้างสรรค์ คุณจะพูดได้อย่างคล่องแคล่ว ChatClient คล้ายกับ WebClient/RestClientรวมถึงคำแนะนำสำหรับรูปแบบ AI ทั่วไป เช่น RAG และหน่วยความจำเชิงสนทนา การกำหนดค่าอัตโนมัติด้วย Spring Boot starters และยูทิลิตี้สำหรับการตรวจสอบการใช้งานโทเค็นและการตรวจจับภาพลวงตา

ภายใน “ปัญญาประดิษฐ์ในฤดูใบไม้ผลิกับการใช้งานจริง”: จากโลกของปัญญาประดิษฐ์ (Hello AI World) ไปจนถึงเอเจนต์เต็มรูปแบบ

หนังสือ “Spring AI in Action” โดย Craig Walls เป็นคู่มือภาคปฏิบัติที่แสดงให้คุณเห็นวิธีการใช้ความสามารถทั้งหมดของ Spring AI ในแอปพลิเคชันจริง หนังสือเล่มนี้มุ่งเป้าไปที่นักพัฒนา Spring โดยเฉพาะ และถือว่าคุณรู้จัก Spring Boot อยู่แล้ว แต่ไม่จำเป็นต้องมีประสบการณ์ด้าน AI เชิงสร้างสรรค์มาก่อน คุณไม่จำเป็นต้องเป็นนักวิทยาศาสตร์ข้อมูลหรือ "ผู้เชี่ยวชาญด้าน AI" ก็สามารถทำตามได้

การเดินทางในหนังสือเล่มนี้เริ่มต้นด้วยตัวอย่างง่ายๆ อย่าง “Hello AI World” และค่อยๆ แนะนำเทคนิคขั้นสูงขึ้นเรื่อยๆ เมื่อคุณเริ่มคุ้นเคยมากขึ้น คุณเริ่มต้นด้วยการเชื่อมต่อการเรียกใช้ LLM พื้นฐานภายในแอป Spring Boot จากนั้นจึงพัฒนาไปสู่การสร้างบทสรุปข้อความ การสร้างผู้ช่วยที่ทำงานอยู่ภายในบริการเว็บหรือแบ็กเอนด์ที่มีอยู่ของคุณ และการปรับแต่งข้อความแจ้งเตือนเพื่อให้คำตอบมีประโยชน์และคาดเดาได้มากขึ้น

เมื่อคุณเรียนไปเรื่อย ๆ เนื้อหาจะเจาะลึกไปถึง RAG, ที่เก็บข้อมูลแบบเวกเตอร์ และสถานการณ์แบบมัลติโมดอลที่โมเดลทำงานร่วมกับทั้งข้อความและรูปภาพ คุณจะได้เรียนรู้วิธีการตั้งคำถามเกี่ยวกับเอกสารส่วนตัวที่โมเดลไม่เคยได้รับการฝึกฝนมาก่อน วิธีการแปลงรูปภาพเป็นข้อความและในทางกลับกัน และวิธีการเชื่อมโยงคำตอบของ LLM กับข้อมูลของคุณเอง เพื่อไม่ให้โมเดลเกิดความเข้าใจผิดเมื่อเผชิญกับคำถามเฉพาะด้าน

ครึ่งหลังของหนังสือเล่มนี้ยกระดับขึ้นไปอีกขั้นด้วยการสำรวจเรื่องเอเจนต์ การใช้เครื่องมือ การพูด และการสังเกตการณ์ ในที่นี้ คุณจะได้เรียนรู้วิธีการสร้างเอเจนต์ AI ที่สามารถตัดสินใจได้ว่าจะเรียกใช้เครื่องมือหรือ API เมื่อใด วิธีการกำหนดเส้นทางงานไปยังข้อความแจ้งเตือนเฉพาะ วิธีการติดตามสิ่งที่เกิดขึ้นผ่านตัวชี้วัดและร่องรอย และวิธีการรักษาความปลอดภัยของระบบของคุณด้วยการประเมินและการป้องกันเนื้อหาที่สร้างขึ้น

ตลอดทั้งเล่ม เครก วอลล์ส ยังคงใช้สไตล์ที่เป็นเอกลักษณ์ของเขา ซึ่งเน้นการยกตัวอย่างประกอบ โดยมุ่งเน้นที่ "การลงมือทำ" แทนที่จะทำให้ผู้อ่านจมอยู่กับทฤษฎีมากมาย แต่ละบทเต็มไปด้วยตัวอย่างที่นำไปใช้ได้จริงและสถานการณ์ที่สมจริง เช่น แชทบอทที่รู้จักข้อมูลของคุณจริง ๆ ผู้ช่วยที่ฝังอยู่ในขั้นตอนการทำงานทางธุรกิจ และเอเจนต์ที่แบ่งงานที่ซับซ้อนออกเป็นชิ้นเล็ก ๆ ที่จัดการได้ง่ายขึ้น

หัวข้อหลักและโครงสร้างของหนังสือ

สารบัญของหนังสือ “Spring AI in Action” แสดงให้เห็นภาพรวมที่ชัดเจนของขอบเขตสิ่งที่คุณจะได้สร้างขึ้น ตั้งแต่ส่วนประกอบพื้นฐานไปจนถึงรูปแบบขั้นสูง แต่ละบทจะเน้นไปที่ด้านเฉพาะของการบูรณาการ AI กับ Spring:

  • เริ่มต้นใช้งาน Spring AI: การเริ่มต้นโปรเจ็กต์ การกำหนดค่าผู้ให้บริการ การส่งข้อความแจ้งเตือนครั้งแรก
  • การประเมินผลตอบรับที่ได้รับ: การวัดคุณภาพ การตรวจจับปัญหา และการป้องกันเนื้อหาคุณภาพต่ำหรือเนื้อหาที่บิดเบือนความจริง
  • ส่งคำสั่งสำหรับการสร้างการออกแบบคำถามกระตุ้น การใช้เทมเพลต และการควบคุมพฤติกรรมของโมเดล
  • พูดคุยกับเอกสารของคุณ: การนำ RAG มาใช้เพื่อให้ LLM สามารถตอบคำถามเกี่ยวกับข้อมูลส่วนตัวที่ไม่ได้ผ่านการฝึกฝนได้
  • การเปิดใช้งานหน่วยความจำการสนทนา: การรักษาบริบทการสนทนาแบบหลายรอบโดยใช้ตัวช่วยจัดการหน่วยความจำของ Spring AI
  • การเปิดใช้งานการสร้างโดยใช้เครื่องมือ: อนุญาตให้โมเดลเรียกใช้ฟังก์ชันและเครื่องมือฝั่งไคลเอ็นต์เมื่อต้องการข้อมูลใหม่หรือข้อมูลภายนอก
  • การประยุกต์ใช้โปรโตคอลบริบทโมเดล (MCP): การจัดการบริบทและการโต้ตอบที่ซับซ้อนยิ่งขึ้นกับเครื่องมือและแหล่งข้อมูลต่างๆ
  • สร้างด้วยเสียงและภาพ: การผนวกรวมความสามารถแบบมัลติโมดอลสำหรับเสียงและภาพ
  • การสังเกตการทำงานของ AI: เพิ่มความสามารถในการสังเกตการณ์และติดตามตรวจสอบเข้าไปในกระบวนการทำงาน AI ของคุณ
  • การปกป้องปัญญาประดิษฐ์เชิงสร้างสรรค์: การนำระบบป้องกัน การกรองเนื้อหา และกลไกการป้องกันอื่นๆ มาใช้
  • การประยุกต์ใช้รูปแบบ AI เชิงสร้างสรรค์: การรวบรวมรูปแบบที่สามารถนำกลับมาใช้ซ้ำได้สำหรับเวิร์กโฟลว์ AI
  • ตัวแทนว่าจ้าง: การสร้างระบบตัวแทนที่สามารถวางแผน กำหนดเส้นทาง และปรับปรุงการทำงานให้มีประสิทธิภาพยิ่งขึ้น

บทวิจารณ์จากผู้ทรงคุณวุฒิในแวดวง Spring และ Java ชี้ให้เห็นว่าเนื้อหานี้เข้าถึงง่ายและใช้งานได้จริงเพียงใด ผู้เขียนคำนำและผู้วิจารณ์ต่างชื่นชมหนังสือเล่มนี้ในด้านคำอธิบายที่ชัดเจน การสาธิตที่ครอบคลุม และข้อมูลเชิงลึกที่เปรียบเสมือน "ขุมทรัพย์" เกี่ยวกับเทคโนโลยีเกิดใหม่ โดยเน้นย้ำว่าหนังสือเล่มนี้ยังคงอยู่บนพื้นฐานของการพัฒนาในโลกแห่งความเป็นจริงมากกว่านามธรรมทางวิชาการ

เมื่อคุณซื้อหนังสือฉบับพิมพ์จากสำนักพิมพ์ Manning คุณจะได้รับอีบุ๊กฟรี (ไฟล์ PDF หรือ ePub) พร้อมสิทธิ์เข้าถึงเวอร์ชัน liveBook ออนไลน์ของพวกเขาด้วย แพลตฟอร์ม liveBook นั้นมีผู้ช่วย AI ที่สามารถตอบคำถามของคุณได้หลายภาษา คุณจึงสามารถสำรวจตัวอย่าง ค้นหาข้อมูลในเนื้อหา และชี้แจงหัวข้อต่างๆ ขณะที่คุณอ่านได้

คุณสมบัติหลักของ Spring AI สำหรับแอปพลิเคชัน AI ระดับองค์กร

นอกเหนือจากเนื้อหาในหนังสือแล้ว เฟรมเวิร์ก Spring AI ยังมีชุดคุณสมบัติที่ครอบคลุมซึ่งออกแบบมาเพื่อแอปพลิเคชัน AI ระดับใช้งานจริง มันไม่ใช่แค่เรื่องการเรียกใช้ LLM เท่านั้น แต่เป็นการสร้างระบบที่สมบูรณ์แบบซึ่งมีความปลอดภัย ตรวจสอบได้ ทดสอบได้ และใช้งานได้กับผู้ให้บริการและสภาพแวดล้อมต่างๆ

ความยืดหยุ่นในระดับเดียวกันนี้ยังขยายไปถึงที่เก็บข้อมูลแบบเวกเตอร์ด้วย ด้วยการรองรับ Apache Cassandra, Azure Vector Search, Chroma, Milvus, MongoDB Atlas, Neo4j, Oracle, PostgreSQL/PGVector, Pinecone, Qdrant, Redis, Weaviate และอื่นๆ คุณสามารถใช้งาน RAG และการค้นหาเชิงความหมายได้โดยไม่ต้องผูกแอปของคุณกับโซลูชันการจัดเก็บข้อมูลเพียงอย่างเดียว API ที่พกพาสะดวกและตัวกรองเมตาเดต้าที่แสดงออกได้ดีทำให้การเรียกใช้การค้นหาความคล้ายคลึงที่ซับซ้อนทำได้ง่ายขึ้น

เครื่องมือและการเรียกใช้ฟังก์ชันเป็นองค์ประกอบสำคัญอันดับแรกใน Spring AI โมเดลสามารถร้องขอให้เรียกใช้เครื่องมือและฟังก์ชันฝั่งไคลเอ็นต์เพื่อดึงข้อมูลแบบเรียลไทม์หรือกระตุ้นการกระทำต่างๆ ซึ่งจะเปลี่ยน LLM ของคุณจากเครื่องมือสร้างข้อความแบบพาสซีฟให้กลายเป็นส่วนประกอบแบบแอคทีฟที่สามารถสอบถาม API เรียกใช้ฐานข้อมูล หรือจัดการบริการต่างๆ ผ่านการเรียกใช้ฟังก์ชันแบบกำหนดประเภทได้

ระบบตรวจสอบการทำงานถูกผสานรวมอยู่ในเฟรมเวิร์กอยู่แล้ว คุณจึงสามารถดูได้ว่า AI ของคุณกำลังทำอะไรอยู่เบื้องหลัง คุณสามารถรวบรวมข้อมูลเมตริกเกี่ยวกับการใช้งานโทเค็น ความหน่วงแฝง และอัตราข้อผิดพลาด ติดตามการเรียกใช้งานผ่านระบบของคุณ และเชื่อมโยงกิจกรรม LLM กับไมโครเซอร์วิสอื่นๆ ของคุณได้ ซึ่งเป็นสิ่งสำคัญอย่างยิ่งเมื่อ AI ก้าวจากขั้นตอนการทดลองไปสู่ภาระงานที่สำคัญต่อธุรกิจ

นอกจากนี้ Spring AI ยังมีเฟรมเวิร์กการนำเข้าเอกสารแบบ ETL สำหรับงานด้านวิศวกรรมข้อมูลอีกด้วย โปรแกรมนี้ช่วยให้คุณโหลด แบ่งกลุ่ม และจัดทำดัชนีเอกสารลงในที่เก็บข้อมูลแบบเวกเตอร์ เพื่อให้ไปป์ไลน์ RAG ของคุณมีความแข็งแกร่งและทำซ้ำได้ แทนที่จะเป็นเพียงชุดสคริปต์เฉพาะกิจ

ChatClient, ที่ปรึกษา และความสามารถในการสนทนา

ในระดับการเขียนโค้ด ปฏิสัมพันธ์ส่วนใหญ่ของ Spring AI จะเกี่ยวข้องกับสิ่งต่อไปนี้ ChatClient API คืออินเทอร์เฟซที่ใช้งานง่าย ซึ่งได้รับแรงบันดาลใจจากรูปแบบ Spring WebClient และ RestClient ที่คุ้นเคย คุณสามารถสร้างและส่งข้อความแจ้งเตือน รับการตอบกลับ สตรีมโทเค็นเมื่อมาถึง และจัดการข้อผิดพลาดในลักษณะที่นักพัฒนา Spring รู้สึกคุ้นเคยได้ทันที

ที่ปรึกษาเป็นอีกหนึ่งแนวคิดเชิงนามธรรมที่สำคัญ ซึ่งรวบรวมรูปแบบ AI เชิงสร้างสรรค์ทั่วไปเอาไว้ พวกมันแปลงข้อมูลที่เข้าและออกจาก LLM เพิ่มพฤติกรรมต่างๆ เช่น RAG หรือหน่วยความจำ และให้ความสามารถในการพกพาข้ามโมเดลและกรณีการใช้งาน แทนที่จะเขียนโค้ดสำหรับคำถามหรือบริบทแต่ละอย่างด้วยตนเอง คุณเพียงแค่เสียบ Advisors เข้าไปเพื่อให้ได้พฤติกรรมที่แข็งแกร่งด้วยโค้ดพื้นฐานน้อยที่สุด

หน่วยความจำบทสนทนาได้รับการจัดการผ่านที่ปรึกษาหน่วยความจำแชทเฉพาะทางที่จัดการบทสนทนาแบบหลายรอบ เนื่องจาก LLM นั้นไม่มีสถานะและ "ลืม" การสนทนาในอดีต ที่ปรึกษาเหล่านี้จึงติดตามประวัติการสนทนาและป้อนบริบทที่เหมาะสมกลับเข้าไปในแต่ละคำถาม คุณสามารถเลือกกลยุทธ์ต่างๆ ได้ และแม้กระทั่งนำหน่วยความจำระยะยาวแบบถาวรมาใช้ด้วยวิธีการแบบเวกเตอร์

การผสานรวมหน่วยความจำการสนทนาและ RAG Advisors ช่วยให้คุณสร้างผู้ช่วยที่สามารถ "พูดคุย" กับเอกสารของคุณได้หลายรอบ ผู้ใช้สามารถถามคำถามเพิ่มเติม ปรับปรุงคำถาม และอ้างอิงถึงส่วนต่างๆ ของบทสนทนาที่ผ่านมาได้ ในขณะที่ Spring AI จะดึงและแทรกข้อความจากเอกสารที่เกี่ยวข้องมากที่สุดโดยอัตโนมัติสำหรับทุกคำขอ

เทมเพลตคำถามช่วยให้การแยกคำถามออกไปใช้ภายนอกและการนำคำถามกลับมาใช้ใหม่เป็นเรื่องง่าย คุณกำหนดเทมเพลตทั่วไปที่รับพารามิเตอร์ รวมคำแนะนำเพิ่มเติม และระบุรูปแบบเอาต์พุตที่ต้องการ (ตัวอย่างเช่น JSON ที่แมปโดยตรงกับอ็อบเจ็กต์ Java) ก่อนที่จะส่งคำแจ้งเตือน Spring AI จะเติมข้อมูลที่ขาดหายไป ใช้บริบท และตรวจสอบให้แน่ใจว่าคำแนะนำนั้นชัดเจนสำหรับโมเดล

RAG (ระบบลดอาการประสาทหลอนและระบบช่วยเหลือที่รับรู้เอกสาร)

รูปแบบการสร้างผลลัพธ์เสริมด้วยการค้นหา (Retrieval Augmented Generation หรือ RAG) เป็นหนึ่งในรูปแบบที่สำคัญที่สุดที่กล่าวถึงทั้งในกรอบแนวคิดและในหนังสือ มันช่วยแก้ข้อจำกัดที่สำคัญของระบบจัดการความรู้แบบคงที่ (Static LLM) ซึ่งก็คือ ระบบเหล่านี้รู้จักเฉพาะสิ่งที่ได้รับการฝึกฝนมาเท่านั้น หมายความว่าโดยค่าเริ่มต้นแล้ว ระบบจะไม่สามารถมองเห็นเอกสารภายใน ข้อมูลลูกค้า หรือความรู้ที่เป็นกรรมสิทธิ์ของคุณได้

ด้วย RAG แอปพลิเคชันของคุณจะดึงเอกสารจำนวนเล็กน้อยที่มีความหมายคล้ายคลึงกับคำถามของผู้ใช้ก่อน จากนั้นจึงป้อนเอกสารเหล่านั้นเข้าสู่โมเดลเพื่อใช้เป็นบริบท Spring AI ช่วยลดภาระงานเหล่านี้ลงอย่างมาก โดยผสานรวมกับแหล่งเก็บเวกเตอร์หลายสิบแห่ง และมี API สำหรับการค้นหาตามความคล้ายคลึงกัน กรองตามเมตาเดต้า และปรับแต่งวิธีการแบ่งส่วนและฝังเนื้อหาของคุณ

การนำ RAG มาใช้อย่างถูกต้องจะช่วยลดอาการประสาทหลอนได้อย่างมาก แทนที่จะคาดเดาเมื่อขาดข้อมูลหรือได้รับการฝึกฝนมากเกินไปกับข้อมูลอินเทอร์เน็ตทั่วไป โมเดลจะถูกชี้นำไปยังข้อมูลตัวอย่างคุณภาพสูงเฉพาะด้าน หนังสือเล่มนี้จะอธิบายกรณีศึกษา "สนทนากับเอกสารของคุณ" และ "ถาม-ตอบเกี่ยวกับเอกสารของคุณ" ซึ่งแสดงให้เห็นรูปแบบนี้ตั้งแต่ต้นจนจบ

ตลอด QuestionAnswerAdvisor และ ChatClientคุณสามารถควบคุมกระบวนการทำงานของ RAG ทั้งหมดได้อย่างชัดเจน หรือปล่อยให้ Advisor จัดการการฝังข้อมูล การดึงข้อมูล และการแทรกบริบทให้คุณก็ได้ นั่นทำให้คุณมีความยืดหยุ่น: เริ่มต้นด้วยวิธีการที่เรียบง่ายเพื่อดำเนินการอย่างรวดเร็ว จากนั้นลดระดับลงเมื่อคุณต้องการพฤติกรรมที่กำหนดเองหรือการปรับแต่งขั้นสูง

เนื่องจาก Spring AI รองรับการส่งข้อมูลแบบเรียลไทม์ คำตอบที่คำนึงถึงเอกสารเหล่านั้นจึงสามารถส่งกลับไปยังส่วนติดต่อผู้ใช้ได้ทันทีที่สร้างเสร็จ นี่เป็นการจำลองการพิมพ์ของมนุษย์แบบเรียลไทม์และมอบประสบการณ์การใช้งานที่ดีกว่า โดยเฉพาะอย่างยิ่งเมื่อคำตอบยาวหรือโมเดลมีความล่าช้าสูง

รูปแบบเชิงตัวแทนที่ได้รับแรงบันดาลใจจากการวิจัยด้านมนุษยศาสตร์

นอกจากนี้ Spring AI ยังนำรูปแบบตัวแทน (agentic patterns) ที่ได้รับแรงบันดาลใจจากการวิจัยของ Anthropic ในการสร้างตัวแทน LLM ที่มีประสิทธิภาพมาใช้ด้วย เน้นที่ความเรียบง่ายและการประกอบเข้าด้วยกันได้ง่าย มากกว่าเฟรมเวิร์กเอเจนต์ขนาดใหญ่ที่ซับซ้อน ซึ่งสอดคล้องกับข้อกำหนดขององค์กรสำหรับระบบที่บำรุงรักษาและทดสอบได้

รูปแบบแรกคือ เวิร์กโฟลว์แบบลูกโซ่ ซึ่งแบ่งงานขนาดใหญ่เป็นขั้นตอนย่อยๆ ที่เรียงลำดับกัน แต่ละขั้นตอนจะใช้ข้อความแจ้งเตือนของตัวเอง ประมวลผลผลลัพธ์จากขั้นตอนก่อนหน้า และสร้างผลลัพธ์ระดับกลางที่ปรับปรุงแล้ว ใน Spring AI นั้น จะมีลักษณะเป็นการวนซ้ำผ่านข้อความแจ้งเตือนของระบบและเรียกใช้ ChatClient ทำซ้ำไปเรื่อยๆ โดยนำเอาคำตอบก่อนหน้ามาใช้เป็นส่วนหนึ่งของข้อมูลป้อนเข้าถัดไป ทำให้เกิดเป็นกระบวนการทำงานที่ชัดเจนและขยายได้

เวิร์กโฟลว์แบบขนาน คือการเรียกใช้ LLM หลายๆ ครั้งพร้อมกัน และรวบรวมผลลัพธ์ของฟังก์ชันเหล่านั้น คุณสามารถใช้ฟังก์ชันนี้สำหรับการ "แบ่งส่วน" (การแบ่งงานออกเป็นส่วนย่อยๆ ที่เป็นอิสระต่อกัน) หรือ "การลงคะแนน" (การให้โมเดลหลายๆ ตัวทำงานตามคำสั่งเดียวกัน แล้วจึงรวมผลลัพธ์เข้าด้วยกัน) ตัวอย่างเช่น คุณอาจขอให้โมเดลวิเคราะห์ผลกระทบของการเปลี่ยนแปลงของตลาดต่อลูกค้า พนักงาน นักลงทุน และซัพพลายเออร์ไปพร้อมๆ กัน จากนั้นจึงรวมข้อมูลเชิงลึกเหล่านั้นเข้าด้วยกัน

กระบวนการทำงานด้านการกำหนดเส้นทาง (Routing Workflow) นำเสนอการจัดส่งอัจฉริยะเข้ามาผสมผสานด้วย ระบบ LLM จะจำแนกประเภทข้อมูลขาเข้าก่อน และตัดสินใจว่าควรประมวลผลคำถามหรือตัวจัดการเฉพาะทางใด: คำถามเกี่ยวกับการเรียกเก็บเงินจะส่งไปยังคำถามของผู้เชี่ยวชาญ คำถามเกี่ยวกับปัญหาทางเทคนิคจะส่งไปยังคำถามของผู้เชี่ยวชาญอีกราย และคำถามทั่วไปจะส่งไปยังตัวช่วยทั่วไป เวิร์กโฟลว์การกำหนดเส้นทางของ Spring AI จะเชื่อมโยงตรรกะเหล่านี้เข้าด้วยกันผ่าน ChatClient และแผนที่เส้นทาง

Orchestrator-Workers เป็นรูปแบบที่ซับซ้อนขึ้น แต่ยังคงหลีกเลี่ยงความเป็นอิสระที่ควบคุมไม่ได้ โมเดล "ผู้ประสานงาน" ส่วนกลางจะแบ่งงานที่ซับซ้อนออกเป็นงานย่อย จากนั้นผู้เชี่ยวชาญเฉพาะด้านจะจัดการกับงานย่อยเหล่านั้น โดยมักจะทำพร้อมกัน เมื่อผู้เชี่ยวชาญแต่ละคนทำงานเสร็จแล้ว ผลลัพธ์ของพวกเขาจะถูกรวมเข้าด้วยกันเป็นผลลัพธ์สุดท้าย Spring AI มีส่วนประกอบพื้นฐานในการนำรูปแบบนี้ไปใช้ ในขณะที่ยังคงรักษาความรับผิดชอบให้ชัดเจนและคาดการณ์ได้

สุดท้ายนี้ รูปแบบ Evaluator-Optimizer ใช้โมเดลสองแบบที่ทำงานร่วมกัน โมเดลหนึ่งทำหน้าที่เป็นตัวสร้างที่เสนอแนวทางแก้ไข ในขณะที่โมเดลที่สองทำหน้าที่เหมือนนักวิจารณ์หรือผู้ตรวจสอบ ตรวจสอบแนวทางแก้ไขตามเกณฑ์ที่ชัดเจนและให้ข้อเสนอแนะเพื่อการปรับปรุง วงจรนี้จะดำเนินต่อไปจนกว่าผู้ประเมินจะพอใจ โดยจะสร้างคำตอบที่ได้รับการปรับปรุงพร้อมกับบันทึกวิวัฒนาการของแนวทางแก้ไขนั้น

แนวปฏิบัติที่ดีที่สุด ความน่าเชื่อถือ และวิวัฒนาการในอนาคต

รูปแบบและคุณสมบัติใน Spring AI มาพร้อมกับแนวทางปฏิบัติที่ดีที่สุดที่ชัดเจน ซึ่งได้มาจากทั้งงานวิจัยของ Anthropic และประสบการณ์การใช้งานจริงของระบบนิเวศ Spring คำแนะนำทั่วไปคือให้เริ่มต้นด้วยขั้นตอนการทำงานที่ง่ายที่สุดเท่าที่จะเป็นไปได้ จากนั้นค่อยเพิ่มความซับซ้อนเมื่อเห็นได้ชัดว่าเป็นการเพิ่มมูลค่า

ความน่าเชื่อถือควรเป็นสิ่งสำคัญอันดับแรกในระบบใดๆ ที่ใช้ LLM (Low Learning Management) นั่นหมายถึงการใช้เอาต์พุตที่มีโครงสร้างและปลอดภัยต่อประเภทข้อมูลทุกครั้งที่เป็นไปได้ การตรวจสอบความถูกต้องของคำตอบ การเพิ่มการจัดการข้อผิดพลาดและการลองใหม่ที่มีประสิทธิภาพ และการติดตั้งเครื่องมือวัดและบันทึกข้อมูลในไปป์ไลน์ของคุณ เมื่อมีสิ่งผิดปกติเกิดขึ้น คุณควรจะเข้าใจสาเหตุและแก้ไขได้อย่างรวดเร็ว

นักพัฒนาควรพิจารณาอย่างรอบคอบถึงความสมดุลระหว่างความหน่วงและความแม่นยำ การเชื่อมโยงหลายขั้นตอนหรือการเพิ่มลูปประเมินผลสามารถปรับปรุงคุณภาพได้อย่างมาก แต่ก็จะทำให้เวลาตอบสนองและปริมาณการใช้โทเค็นเพิ่มขึ้นด้วย การประมวลผลแบบขนานสามารถช่วยเพิ่มความเร็วได้ แต่เฉพาะในกรณีที่งานแต่ละงานเป็นอิสระต่อกันอย่างแท้จริงเท่านั้น

งานในอนาคตของระบบนิเวศ Spring AI จะช่วยเพิ่มขีดความสามารถด้านการประกอบรูปแบบ กลยุทธ์หน่วยความจำขั้นสูง และการบูรณาการเครื่องมือให้ลึกซึ้งยิ่งขึ้น การประกอบรูปแบบต่างๆ เข้าด้วยกัน เช่น การเชื่อมโยง การกำหนดเส้นทาง และลูปประเมินผล ช่วยให้คุณสร้างเอเจนต์ที่ซับซ้อนแต่ยังคงเข้าใจได้ง่าย การจัดการหน่วยความจำขั้นสูงสำรวจบริบทที่คงอยู่ หน้าต่างบริบทที่มีประสิทธิภาพ และการเก็บรักษาความรู้ในระยะยาว

การบูรณาการเครื่องมือและโปรโตคอลบริบทโมเดล (MCP) เป็นอีกหนึ่งด้านที่มีการพัฒนาอย่างต่อเนื่อง อินเทอร์เฟซที่เป็นมาตรฐานสำหรับเครื่องมือภายนอกและโปรโตคอลที่ครอบคลุมมากขึ้นสำหรับบริบทของโมเดล หมายความว่าเอเจนต์สามารถเข้าถึงบริการ API และแหล่งข้อมูลของคุณได้อย่างปลอดภัยและยืดหยุ่น ภายใต้ระบบการกำกับดูแลและการตรวจสอบของคุณ

Spring AI ในแพลตฟอร์มที่กว้างขึ้น: Tanzu Gen AI Solutions

สำหรับองค์กรที่ใช้งานชุดซอฟต์แวร์ Tanzu ของ VMware นั้น Spring AI ยังเป็นรากฐานสำคัญของโซลูชัน Tanzu Gen AI อีกด้วย Tanzu AI Server ซึ่งขับเคลื่อนโดย Spring AI มอบสภาพแวดล้อมที่พร้อมใช้งานจริงสำหรับการปรับใช้แอปพลิเคชัน AI บนแพลตฟอร์ม Tanzu พร้อมด้วยความปลอดภัย การกำกับดูแล และความสามารถในการขยายขนาดในระดับองค์กร

การผสานรวมนี้ช่วยให้เข้าถึงโมเดลต่างๆ เช่น Amazon Bedrock Nova ได้ง่ายขึ้นผ่านอินเทอร์เฟซที่เป็นหนึ่งเดียว แทนที่แต่ละทีมจะเชื่อมต่อโมเดลด้วยตนเอง แพลตฟอร์มนี้จะกำหนดมาตรฐานการเข้าถึง นโยบายความปลอดภัย และเครื่องมือในการดำเนินงาน Spring AI จัดการเรื่องการพกพาโมเดล ในขณะที่ Tanzu มอบโครงสร้างพื้นฐานที่แข็งแกร่ง การปรับขนาดอัตโนมัติ และการตรวจสอบที่คาดหวังได้จากแพลตฟอร์ม Kubernetes ที่ทันสมัย

เนื่องจาก Spring AI รับผิดชอบในการสร้างนามธรรมระดับแอปพลิเคชัน ทีมงานจึงสามารถเปลี่ยนไปใช้ผู้ให้บริการรายอื่นหรือนำโมเดลใหม่มาใช้ได้โดยไม่ต้องเขียนโค้ดตรรกะทางธุรกิจใหม่ ความสามารถในการปรับตัวนั้นมีความสำคัญอย่างยิ่งในแวดวง AI ที่เปลี่ยนแปลงอย่างรวดเร็ว ซึ่งมีโมเดลใหม่ๆ ปรากฏขึ้นบ่อยครั้ง และราคาหรือความสามารถต่างๆ ก็สามารถเปลี่ยนแปลงได้อย่างรวดเร็ว

คุณสมบัติด้านความปลอดภัยและการกำกับดูแลในโซลูชัน AI ของ Tanzu Gen ช่วยให้แอปพลิเคชัน AI เหล่านี้อยู่ภายใต้การควบคุมระดับองค์กรเดียวกันกับที่ใช้สำหรับไมโครเซอร์วิสอื่นๆ นโยบาย การควบคุมการเข้าถึง บันทึกการตรวจสอบ และเครื่องมือการปฏิบัติตามกฎระเบียบ สามารถนำไปใช้กับเวิร์กโหลด LLM ได้อย่างเป็นธรรมชาติ ทำให้สามารถใช้งานกรณีที่มีความละเอียดอ่อนหรืออยู่ภายใต้ข้อกำหนดต่างๆ ได้อย่างมีประสิทธิภาพมากขึ้น

องค์ประกอบทั้งหมดเหล่านี้ ไม่ว่าจะเป็นเฟรมเวิร์ก หนังสือ รูปแบบ และแพลตฟอร์ม ล้วนมีเป้าหมายเดียวกัน นั่นคือ การช่วยให้นักพัฒนา Spring สามารถเพิ่มคุณสมบัติ AI ที่มีมูลค่าสูง เช่น ผู้ช่วยเสมือน การค้นหาอัจฉริยะ การสรุปข้อความ และคำแนะนำ ลงในแอปพลิเคชัน Java ได้โดยตรง โดยไม่ลดทอนความน่าเชื่อถือหรือการควบคุม ด้วยหนังสือ Spring AI in Action เป็นคู่มือภาคปฏิบัติ และ Spring AI เป็นแกนหลักทางด้านวิศวกรรม คุณสามารถเปลี่ยนจากการทดลองไปสู่บริการที่ขับเคลื่อนด้วย AI ที่แข็งแกร่งได้ โดยยังคงอยู่ภายในระบบนิเวศของ Spring ที่คุณคุ้นเคยเป็นอย่างดีอยู่แล้ว

comprobar si AWS está caído
บทความที่เกี่ยวข้อง:
Cómo comprobar si AWS está caído: estado, causas y alcance real
กระทู้ที่เกี่ยวข้อง: