Journal
Round Online's working notebook — essays, project plans, concept art, and thinking-in-progress before it locks as an axiom or ships as a product.
The studio’s working notebook. Essays on how we think, plans for what’s coming, concept art for work in early shape, and the in-progress thinking that hasn’t yet locked into an axiom or shipped as a product.
Some pieces here will eventually crystallise into a studio axiom system. Some will stay as essays — useful as record, never meant to be a rule.
-
เบื้องหลังคำตอบของ AI คือตัวเลข
ก่อนจะเข้าใจ RAG หรือ agent ต้องเข้าใจชิ้นส่วนพื้นฐานก่อน · บทนี้พาเข้าใจคณิตศาสตร์ง่าย ๆ เบื้องหลัง ว่า LLM ทำงานยังไง · embedding เปลี่ยนข้อความเป็นตัวเลขได้ยังไง · index หาของเจอเร็วเพราะอะไร · reranker ต่างจาก embedding ตรงไหน · และทำไม LLM ถึงต้องพึ่ง RAG · ปฐมบทของ LLM systems series
-
เปลี่ยนกองเอกสารให้กลายเป็นคำตอบ
ระบบ AI ตอบจากเอกสารจริงได้ ต้องค้น (retrieve) ให้เจอก่อน — และจะค้นได้ต้องมี index ก่อน · บทนี้พาดูฝั่งเขียนของ RAG — เปลี่ยนเอกสารดิบจำนวนมากให้กลายเป็นคลังที่ค้นได้ ผ่าน extract → chunk → embed → store · ทำไมต้องตัด chunk · embed อะไรไม่ embed อะไร · recall แล้ว rerank ทำงานคู่กันยังไง · provenance ที่ทำให้คำตอบอ้างกลับได้ · และอะไรพังเมื่อเอกสารโตเป็นแสน บทที่ 6 ของ LLM systems series · คู่ฝั่งเขียนของบทที่ 5
-
เฝ้าความเงียบ
ระบบเฝ้าระวังส่วนใหญ่ทำงานแบบรอสัญญาณ พอมีอะไรเกิดถึงค่อยตอบสนอง แต่ความล้มเหลวอีกแบบไม่ส่งสัญญาณเลย คือสิ่งที่ควรเกิดแล้วไม่เกิด · จะจับมันได้ต้องเลิกรอ event แล้วหันมาไล่ตรวจสถานะตามนาฬิกา เทียบกับสิ่งที่ควรเป็น (invariant) · desired ลบ observed เท่ากับส่วนต่างที่ต้องจัดการ · กลไกเดียวกับ control loop และ audit · บทที่ว่าด้วยการยุบความกลัวสารพัดให้เหลือลูปเดียว
-
ความแน่ใจคือสิ่งที่ทำให้มันเป็นความจำ
ความจำของระบบ AI ไม่ใช่ข้อเท็จจริงถาวร แต่คือความน่าจะจริงที่จางลงตามเวลา — หลักการข้อเดียวนี้ครอบทั้ง 'ระบบจำถูกไหม' และ 'ระบบลืมจริงไหม' · อธิบายผ่านงานวิจัยใหม่ของ Google Research เรื่องการตรวจสอบ machine unlearning และจบที่คำถามเชิงสถาปัตยกรรมที่ทุกทีม AI ต้องตอบ: ความรู้ในระบบของคุณอยู่ที่ไหน และต้นทุนของการพิสูจน์ว่ามันถูกลบ อยู่ที่เท่าไหร่
-
Harness: ทุกอย่างที่ไม่ใช่โมเดล
โมเดลเป็นแค่ชิ้นเดียวในระบบ — ทุกอย่างที่ห่อรอบมัน (loop, tool, context, memory, validation, eval) คือ harness · พอโมเดลกลายเป็น commodity งานที่สร้างความต่างจริงก็ย้ายมาอยู่ที่ harness · บทปิดของ LLM systems series ที่ร้อยห้าบทก่อนหน้าเข้าด้วยกัน
-
จากคำถามสู่คำตอบ: คำถามแบบไหนกลายเป็น tool-call แบบไหนกลายเป็น vector search
คำถามแต่ละชนิดเข้ากับวิธีดึงข้อมูลคนละแบบ — บทนี้พาเข้าใจว่าคำถามแบบไหนเข้ากับ tool-call/text-to-SQL, vector, hybrid หรือ graph และทำไม ผ่าน retrieval pipeline ทั้งเส้น · เมื่อเห็นว่าแต่ละวิธีเก่งงานแบบไหนและแลกมาด้วยอะไร วิธีที่เข้ากับคำถามมักเป็นวิธีที่เบาที่สุดด้วย บทที่ 5 ของ LLM systems series
-
สถาปัตยกรรม Agent ที่อยู่ได้นาน: แยกชั้นตามอัตราการเปลี่ยน
ระบบ AI ไม่ได้ตายเพราะโค้ดเก่า · มันตายเพราะส่วนที่ควรอยู่นานถูกล่ามไว้กับส่วนที่เปลี่ยนเร็ว · บทนี้มองสถาปัตยกรรม agent จากมุมมหภาค — แยกชั้นตามความเร็วที่มันเปลี่ยน แล้ววางสัญญาที่นิ่งไว้ตรงรอยต่อ ให้การเปลี่ยน model เป็นการ swap ชั้นเดียว ไม่ใช่ rewrite ทั้งระบบ · gateway, MCP+registry, orchestration graph, eval บทที่ 4 ของ LLM systems series
-
Data Security ในระบบ LLM: บทเรียนจาก Defender notification หนึ่งครั้ง
Case study จริง — Windows Defender แจ้งว่า transcript ของ Claude Code คือ Trojan:JS/ChatGPTStealer · false positive · แต่เปิดทาง 4 บทเรียนเรื่อง security ของระบบ LLM: ข้อมูลอยู่ที่ไหน (residency), อะไรหลุดเข้าไป (PII), pattern matcher trust อะไร (injection), ใคร review log (audit) — reference สำหรับทีม dev ที่จะใช้ LLM ใน production
-
LLM Landscape กลางปี 2026: ราคา คุณภาพ และวิธีเลือก
Reference การตัดสินใจเลือก LLM กลางปี 2026 — ราคาของ frontier vendors (Anthropic, OpenAI, Google), open-weight ที่ราคาถูกกว่า 30 เท่า (DeepSeek V4, Kimi K2.6, GLM-5, Mistral), economics ของ self-hosting, และ decision framework ห้าคำถาม
-
Raw LLM, Workflow, Agent: เลือกระดับของระบบ AI ให้พอดีกับงาน
กรอบเลือกระดับของระบบที่ใช้ LLM ตั้งแต่ raw LLM call จนถึง agent ที่ตัดสินใจ flow เอง สังเคราะห์จาก Building Effective Agents ของ Anthropic, A Practical Guide to Building Agents ของ OpenAI, และจากการสร้างระบบ customer service จริง
-
Open Loop, Closed Loop: ทำไมการเอา AI มาใช้ ไม่เท่ากับการเป็นบริษัท AI Native
การใช้ AI ในองค์กรส่วนใหญ่ยังเป็น Open loop — คนยังเป็น middleware ระหว่างระบบ AI Native Transformation จริงๆ คือการปิด loop โดยวางคนไว้เฉพาะจุดที่ judgment สำคัญ บทความนี้เสนอกรอบสามวงจร + กฎสามข้อ + วิธีประเมินองค์กรของคุณภายในหนึ่งชั่วโมง