Insights | GoPomelo

ทำความรู้จัก Gemini: โมเดล AI ที่ใหญ่ที่สุดและมีความสามารถมากที่สุดจาก Google

Written by Oliver Machwirth | Dec 18, 2023 6:00:00 AM

Making AI More Helpful for Everyone

ซุนดาร์ พิชัย (Sundar Pichai) ประธานบริษัท Alphabet บริษัทแม่ของ Google ได้กล่าวไว้ว่า

การเปลี่ยนแปลงทางเทคโนโลยีปัจจุบันโดยเฉพาะในด้าน AI ถือเป็นโอกาสที่ยิ่งใหญ่สำหรับการค้นพบทางวิทยาศาสตร์ ความก้าวหน้าของมนุษย์ และการปรับปรุงคุณภาพชีวิต การเปลี่ยนแปลงครั้งนี้อาจเป็นถือเป็นการเปลี่ยนแปลงครั้งสำคัญในประวัติศาสตร์ เกินกว่าการเปลี่ยนแปลงทางด้านมือถือและเว็บไซต์ AI นำมาซึ่งสัญญาณที่จะสร้างโอกาสให้กับคนทั่วโลก เป็นเสถียรสร้างคลื่นใหม่ของนวัตกรรม ความคืบหน้าทางเศรษฐกิจ และการก้าวหน้าที่ไม่เคยมีมาก่อนในด้านความรู้ การเรียนรู้ ความคิดสร้างสรรค์ และประสิทธิภาพในการทำงาน

ความตื่นเต้นอยู่ตรงที่ศักยภาพของ AI ที่จะเป็นประโยชน์ในระดับสากล ซึ่งส่งผลกระทบต่อชีวิตผู้คนทั่วโลก ซึ่งในฐานะบริษัทแห่งแรกที่เน้นการใช้ AI เป็นหลักมาเกือบ 8 ปี ความก้าวหน้าในการประยุกต์ใช้ AI กำลังเร่งตัวขึ้น ขณะนี้คนนับล้านกำลังใช้ AI เจนเนอเรชั่นในผลิตภัณฑ์สำหรับงานที่เป็นไปไม่ได้เมื่อปีที่แล้ว นักพัฒนาใช้ประโยชน์จากโมเดลและโครงสร้างพื้นฐานเหล่านี้เพื่อสร้างแอปพลิเคชัน AI ใหม่ ธุรกิจทั่วโลกกำลังเติบโตด้วยเครื่องมือ AI เหล่านี้

ความก้าวหน้านี้เป็นเพียงจุดเริ่มต้นเท่านั้น แนวทางของ Google ในด้าน AI นั้นชัดเจนและมีความน่าเชื่อถือโดยมุ่งเน้นไปที่การวิจัยและพัฒนาขีดความสามารถที่เป็นประโยชน์ต่อสังคม บูรณาการการป้องกัน และการร่วมมือกับรัฐบาลและผู้เชี่ยวชาญในการจัดการความเสี่ยงที่เกิดขึ้นใหม่

ซึ่งการเปิดตัว Gemini นี้ถือเป็นก้าวใหม่ของความสามารถด้าน AI ของ Google Gemini 1.0 มาพร้อมกัน 3 เวอร์ชันนั่นคือ Ultra, Pro และ Nano ซึ่งถือเป็นก้าวสำคัญในการพัฒนา AI ยุคของแบบจำลองนี้เป็นความพยายามทางวิทยาศาสตร์และวิศวกรรมที่สำคัญของ Google โดยเป็นการเปิดประตูใหม่สู่โอกาสระดับโลก

Introducing Gemini

คุณเดมิส ฮาสซาบิส CEO และผู้ร่วมก่อตั้ง Google DeepMind ได้กล่าวไว้ว่า

AI ถือเป็นหัวข้อที่นักวิจัยหลายๆท่านให้ความสนใจมาเป็นเวลายาวนาน รวมถึงตัวผมเองด้วย ตั้งแต่ช่วงแรกๆ ของการเขียนโปรแกรม AI สำหรับเกมคอมพิวเตอร์ไปจนถึงด้านประสาทวิทยาศาสตร์ เป้าหมายคือการสร้างเครื่องจักรที่ชาญฉลาดขึ้นเพื่อประโยชน์ของมนุษยชาติมาโดยตลอด

Google DeepMind มุ่งเป้าไปที่การสร้างแบบจำลอง AI รุ่นใหม่มาโดยตลอด ซึ่งคล้ายกับการรมีปฏิสัมพันธ์และความเข้าใจของมนุษย์ โดยจุดมุ่งหมายคือการพัฒนา AI ที่ไม่ใช่แค่ซอฟต์แวร์อัจฉริยะ แต่เป็นผู้ช่วยที่มีประโยชน์และใช้งานง่าย

Gemini ช่วยให้วิสัยทัศน์นี้เข้าใกล้ความเป็นจริงมากขึ้น แสดงให้เห็นถึงความพยายามในการทำงานร่วมกัน รวมถึงการวิจัยของ Google Gemini เป็น MultiModal สามารถรองรับข้อมูลได้หลายประเภทเช่น ข้อความ รหัส เสียง รูปภาพ และวิดีโอ ถือเป็นโมเดลที่ยืดหยุ่นที่สุดของ Google ถูกปรับแต่งให้ใช้ได้ทั้งในศูนย์ข้อมูลและบนอุปกรณ์เคลื่อนที่ และยังช่วยเพิ่มประสิทธิภาพของวิธีที่นักพัฒนาและลูกค้าใช้งาน AI

ทำความรู้จัก Gemini: โมเดล AI ที่ใหญ่ที่สุดและมีความสามารถมากที่สุดจาก Google

Gemini ยังเป็นโมเดลที่ยืดหยุ่นที่สุดจนถึงตอนนี้ สามารถทำงานได้อย่างมีประสิทธิภาพทั้งในศูนย์ข้อมูลและบนอุปกรณ์เคลื่อนที่ ความสามารถขั้นสูงนี้จะเสริมสร้างการใช้งานของนักพัฒนาและลูกค้าธุรกิจให้สามารถสร้างและขยายมากขึ้นด้วย AI อย่างมีประสิทธิภาพ

Google เพิ่มประสิทธิภาพ Gemini 1.0 ซึ่งเป็นเวอร์ชันแรกของเรา ทั้ง 3 เวอร์ชั่น

  • Gemini Ultra — โมเดลที่มีประสิทธิภาพมากที่สุด ขนาดใหญ่ที่สุดสำหรับงานที่มีความซับซ้อนสูง
  • Gemini Pro — โมเดลที่ดีที่สุดสำหรับการปรับขนาดในงานที่หลากหลาย
  • Gemini Nano — โมเดลที่มีประสิทธิภาพที่สุดสำหรับใช้งานบนสมาร์ทโฟน

State-of-the-art performance

ประสิทธิภาพที่ล้ำสมัยถือเป็นจุดเด่นของ Gemini ซึ่งได้รับการทดสอบและประเมินผลอย่างพิถีพิถันในงานต่างๆ ที่หลากหลาย ตั้งแต่การทำความเข้าใจภาพธรรมชาติ เสียง และวิดีโอ ไปจนถึงการใช้เหตุผลทางคณิตศาสตร์ ในการวิจัยและพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) ซึ่ง Gemini Ultra แสดงให้เห็นผลลัพธ์ที่ยอดเยี่ยม ซึ่งเหนือกว่ามาตรฐานล่าสุดในปัจจุบันด้วยเกณฑ์มาตรฐานทางวิชาการที่ได้รับการยอมรับอย่างกว้างขวาง 30 รายการจาก 32 รายการ

Gemini Ultra ได้ทำการทำคะแนนอย่างโดดเด่นที่ระดับ 90.0% ความสำเร็จอันก้าวล้ำนี้ถือเป็นโมเดลแรกที่แซงหน้าโมเดลปัญญาประดิษฐ์ที่เลียนแบบมนุษย์ใน MMLU (ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่) การทดสอบนี้เน้นทดสอบทั้งความรู้ทางโลกและทักษะในการแก้ปัญหาด้วยการผสมผสานที่ท้าทายของ 57 หัวข้อที่ประกอบไปด้วยคณิตศาสตร์, ฟิสิกส์, ประวัติศาสตร์, กฎหมาย, การแพทย์, และจริยธรรม

แนวทางที่เป็นนวัตกรรมใหม่สำหรับ MMLU ที่ Gemini นำมาใช้ช่วยให้ใช้ทักษะในการคิดอย่างมีประสิทธิภาพมากขึ้น โดยการพิจารณาอย่างลึกลงก่อนที่จะตอบคำถามที่ซับซ้อน Gemini ให้เห็นถึงความก้าวหน้าที่โดดเด่นเหนือการพึ่งพาการแสดงผลครั้งแรกเพียงอย่างเดียว


Gemini มีประสิทธิภาพเหนือกว่าความสามารถของศาสตร์ปัจจุบันในหลายๆ ข้อวัดรวมถึงข้อวัดที่เกี่ยวข้องกับข้อความและการเขียนโค้ด

แผนภูมิแสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยมของ Gemini Ultra ในการวัดประสิทธิภาพข้อความทั่วไปเมื่อเปรียบเทียบกับ GPT-4 ด้วยการคำนวณหมายเลข API สำหรับตัวเลขที่ไม่ได้รายงาน ในการวัดประสิทธิภาพทั้งข้อความและการเข้ารหัส Gemini ได้สร้างมาตรฐานใหม่แห่งความเป็นเลิศ

นอกจากนี้ Gemini Ultra ยังได้คะแนนถึง 59.4% จากเกณฑ์มาตรฐาน MMMU ใหม่ เกณฑ์มาตรฐานนี้ครอบคลุมงานหลายรูปแบบในโดเมนต่างๆ ที่ต้องใช้เหตุผลอย่างรอบคอบ

ในด้านการวัดประสิทธิภาพรูปภาพ Gemini Ultra มีผลลัพธ์หนือกว่ารุ่นก่อนๆ โดยไม่จำเป็นต้องได้รับการสนับสนุนจากระบบ Object Character Recognition (OCR) ซึ่งโดยทั่วไปจะแยกข้อความจากรูปภาพเพื่อการวิเคราะห์เพิ่มเติม เกณฑ์มาตรฐานเหล่านี้ยืนยันถึงความสามารถหลายรูปแบบโดยธรรมชาติของ Gemini และนำเสนอภาพรวมของความสามารถในการคิดอย่างลึกอีกด้วย

Next-generation capabilities

ความสามารถรุ่นถัดไปแสดงให้เห็นในวิธีนวัตกรรมที่ Google ได้นำมาใช้ในการสร้างโมเดลมัลติโมดัล ซึ่งก่อนหน้านี้มาตรฐานในการพัฒนาโมเดลเกี่ยวข้องการฝึกสอนส่วนที่แตกต่างกันสำหรับโหมดต่าง ๆ ซึ่งตามมาด้วยกระบวนการผสมเพื่อให้ได้ลักษณะของฟังก์ชันมัลติโมดัล ตามด้วยกระบวนการบูรณาการเพื่อให้บรรลุรูปลักษณ์ของฟังก์ชันการทำงานหลายรูปแบบ แม้ว่างานบางอย่างเช่นคำอธิบายรูปภาพจะมีประสิทธิภาพ แต่โมเดลเหล่านี้มักจะสะดุดเมื่อต้องเผชิญกับการให้เหตุผลที่เป็นนามธรรมและซับซ้อนมากขึ้น

ในทางกลับกัน โมเดล Gemini ของ Google ได้รับการออกแบบมาเพื่อรองรับความหลากหลายรูปแบบ การฝึกอบรมเบื้องต้นครอบคลุมรูปแบบต่างๆ มากมาย ซึ่งเป็นการวางรากฐานที่แข็งแกร่ง ต่อจากนั้น โมเดลจะได้รับการปรับแต่งอย่างละเอียดด้วยข้อมูลเพิ่มเติมหลายรูปแบบ ช่วยเพิ่มความแม่นยำและประสิทธิผล แนวทางพื้นฐานนี้ช่วยให้ Gemini เข้าใจและหาเหตุผลจากอินพุตที่หลากหลายได้อย่างเป็นธรรมชาติ เหนือกว่าโมเดลหลายรูปแบบที่มีอยู่ในด้านประสิทธิภาพ ดังนั้นความสามารถของ Gemini จึงได้รับการยกย่องว่าล้ำสมัยในหลายโดเมน

Sophisticated reasoning

Gemini 1.0 ที่ถูกพัฒนาโดย Google แสดงให้เห็นถึงความสามารถในการให้เหตุผลหลายรูปแบบที่ซับซ้อน ช่วยให้ระบบสามารถตีความข้อมูลที่เป็นลายลักษณ์อักษรและภาพที่ซับซ้อนได้ ศักยภาพที่ทันสมัยนี้สามารถทำให้ Gemini 1.0 เป็นเครื่องมือพิเศษในการเปิดเผยความรู้ที่อาจยังคงถูกบดบังในแหล่งรวมข้อมูลที่กว้างขวาง

ความสามารถที่น่าทึ่งของระบบในการรับข้อมูลเชิงลึกจากเอกสารจำนวนมหาศาล โดยการอ่าน กรอง และทำความเข้าใจข้อมูลอย่างมีประสิทธิภาพ กำลังจะส่งเสริมนวัตกรรมในหลาย ๆ ภาคส่วน รวมถึงวิทยาศาสตร์และการเงิน ความสามารถในการประมวลผลข้อมูลด้วยความเร็วดิจิทัลนี้สัญญาว่าจะขับเคลื่อนความก้าวหน้าครั้งสำคัญ

Gemini ปลดล็อกข้อมูลเชิงลึกทางวิทยาศาสตร์ใหม่ๆ

Understanding text, images, audio and more

Gemini 1.0 รับรู้และทำความเข้าใจข้อความ รูปภาพ เสียง และอื่นๆ ไปพร้อมๆ กัน มีความสามารถที่โดดเด่นในการประมวลผลข้อมูลที่มีรายละเอียดปลีกย่อย ความสามารถนี้ทำให้สามารถตอบคำถามในหัวข้อที่ซับซ้อนได้อย่างมีประสิทธิภาพ โดยจุดแข็งของ Gemini 1.0 คือการอธิบายเหตุผลเบื้องหลังวิชาที่ซับซ้อน เช่น คณิตศาสตร์และฟิสิกส์ ซึ่งแสดงให้เห็นถึงความเข้าใจขั้นสูงและทักษะการวิเคราะห์

Gemini อธิบายการใช้เหตุผลในวิชาคณิตศาสตร์และฟิสิกส์

Advanced coding

Gemini แสดงให้เห็นถึงความสามารถในการทำความเข้าใจ อธิบาย และสร้างโค้ดคุณภาพสูงในภาษาโปรแกรมหลักๆ เช่น Python, Java, C++ และ Go ความสามารถข้ามภาษาและการให้เหตุผลด้านข้อมูลที่ซับซ้อนทำให้บริษัทอยู่ในระดับแนวหน้าของโมเดลการเข้ารหัสทั่วโลก

Gemini Ultra มีความโดดเด่นในด้านเกณฑ์มาตรฐานการเข้ารหัสที่สำคัญ รวมถึง HumanEval ซึ่งเป็นมาตรฐานอุตสาหกรรมสำหรับการประเมินประสิทธิภาพงานการเขียนโค้ด และ Natural2Code ซึ่งเป็นชุดข้อมูลภายในของ Google ที่มุ่งเน้นไปที่แหล่งข้อมูลที่ผู้เขียนสร้างขึ้นแทนที่จะเป็นเนื้อหาบนเว็บ

ความยืดหยุ่นของ Gemini ขยายไปถึงการขับเคลื่อนระบบการเขียนโค้ดขั้นสูง Google เปิดตัว AlphaCode เมื่อสองปีที่แล้ว ถือเป็นระบบสร้างโค้ด AI ระบบแรกที่มีประสิทธิภาพในการแข่งขันในการแข่งขันการเขียนโปรแกรม

Google พัฒนา AlphaCode 2 ซึ่งเป็นระบบการสร้างโค้ดที่ซับซ้อนยิ่งขึ้นโดยใช้เทคโนโลยีของ Gemini AlphaCode 2 เป็นเลิศในการแข่งขันด้านการเขียนโปรแกรมที่ท้าทาย โดยผสมผสานแนวคิดทางคณิตศาสตร์และวิทยาการคอมพิวเตอร์เชิงทฤษฎีที่ซับซ้อนเข้าด้วยกัน

เมื่อเปรียบเทียบกับ AlphaCode รุ่นดั้งเดิม AlphaCode 2 แสดงให้เห็นการปรับปรุงที่สำคัญบนแพลตฟอร์มการประเมินผลเดียวกัน ซึ่งช่วยแก้ปัญหาได้เกือบสองเท่า คาดว่าจะมีประสิทธิภาพเหนือกว่าผู้เข้าร่วมการแข่งขันมากกว่า 85% ซึ่งเพิ่มขึ้นอย่างมากจากเกือบ 50% ที่กำหนดโดย AlphaCode AlphaCode 2 ประสบความสำเร็จมากยิ่งขึ้นเมื่อโปรแกรมเมอร์ทำงานร่วมกัน โดยระบุคุณสมบัติสำหรับตัวอย่างโค้ด

Google มีความกระตือรือร้นที่โปรแกรมเมอร์จะใช้โมเดล AI ขั้นสูงเพิ่มมากขึ้น เครื่องมือเหล่านี้ให้การสนับสนุนการทำงานร่วมกัน ช่วยเหลือในการแก้ปัญหา เสนอการออกแบบโค้ด และช่วยเหลือในการดำเนินการ ความร่วมมือนี้ช่วยให้การพัฒนาและการเปิดตัวแอปและการออกแบบบริการที่เหนือกว่าทำได้รวดเร็วยิ่งขึ้น

More reliable, scalable, and efficient

Gemini 1.0 ถูกฝึกฝนในขอบเขตใหญ่บนโครงสร้างพื้นฐานที่ถูกปรับให้เหมาะสมกับ AI โดยใช้ Tensor Processing Units (TPUs) v4 และ v5e ที่ออกแบบมาภายในของ Google โมเดลนี้ถูกพัฒนาเพื่อให้มีความเชื่อถือได้และสามารถขยายขนาดได้สำหรับการฝึก และมีประสิทธิภาพในการใช้งาน

บน TPU ของ Google นั้น Gemini ทำงานเร็วขึ้นอย่างเห็นได้ชัดเมื่อเทียบกับรุ่นก่อนๆ ซึ่งมีขนาดเล็กกว่าและมีความสามารถน้อยกว่า ตัวเร่งความเร็ว AI ที่ออกแบบเองเหล่านี้เป็นพื้นฐานในการขับเคลื่อนผลิตภัณฑ์ที่ขับเคลื่อนด้วย AI ซึ่งมีผู้ใช้งานหลายพันล้านคน เช่น Search, YouTube, Gmail, Google Maps, Google Play และ Android นอกจากนี้ พวกเขายังได้เสริมศักยภาพบริษัทหลายแห่งทั่วโลกในการฝึกอบรมโมเดล AI ขนาดใหญ่ในลักษณะที่คุ้มต้นทุน

ความก้าวหน้าล่าสุดในเทคโนโลยีนี้คือการเปิดตัว Cloud TPU v5p ซึ่งเป็นระบบ TPU ที่ทรงพลัง มีประสิทธิภาพ และปรับขนาดได้มากที่สุดในปัจจุบัน ออกแบบมาโดยเฉพาะสำหรับการฝึกโมเดล AI ขั้นสูง TPU เจเนอเรชั่นถัดไปนี้มีจุดมุ่งหมายเพื่อเร่งการพัฒนา Gemini และช่วยเหลือนักพัฒนาและลูกค้าองค์กรในการฝึกอบรมโมเดล AI เจนเนอเรชั่นขนาดใหญ่ได้รวดเร็วยิ่งขึ้น การปรับปรุงนี้ปูทางไปสู่การส่งมอบผลิตภัณฑ์และความสามารถใหม่ๆ ให้กับลูกค้าได้รวดเร็วยิ่งขึ้น

Built on a Foundation of Responsibility and Safety

GoPomelo ตระหนักถึงความสำคัญของการพัฒนา AI ที่กล้าหาญและมีความรับผิดชอบ ซึ่งเป็นความมุ่งมั่นที่ Google สะท้อนให้เห็นในความพยายามของพวกเขา ด้วยหลักการที่ Google กำหนดขึ้น รวมถึงหลักการของ AI และนโยบายความปลอดภัยที่เข้มงวดซึ่งแพร่หลายในผลิตภัณฑ์ต่างๆ จึงมีการผสมผสานการป้องกันใหม่ๆ เพื่อรองรับความสามารถที่หลากหลายรูปแบบของ Gemini ตลอดการพัฒนา ความเสี่ยงที่อาจเกิดขึ้นได้รับการพิจารณาอย่างรอบคอบ โดยเน้นที่การทดสอบและการบรรเทาผลกระทบ

Gemini ได้รับการประเมินความปลอดภัยอย่างละเอียดที่สุดในหมวดหมู่ของโมเดล AI ของ Google โดยเฉพาะในเรื่องของความลำเอียงและความเสียหาย ซึ่งรวมถึงการวิจัยบุกเบิกในด้านความเสี่ยง เช่น ความผิดทางไซเบอร์ การโน้มน้าวใจ และความเป็นอิสระ เทคนิคการทดสอบฝ่ายตรงข้ามขั้นสูงของฝ่ายวิจัยของ Google เป็นเครื่องมือในการระบุข้อกังวลด้านความปลอดภัยที่สำคัญล่วงหน้าก่อนการใช้งาน Gemini

เพื่อเปิดเผยจุดบอดที่อาจเกิดขึ้นในวิธีการประเมินภายใน เรากำลังดำเนินการร่วมมือกับกลุ่มผู้เชี่ยวชาญภายนอกและพันธมิตรที่หลากหลาย โดยมีเป้าหมายที่จะทดสอบแบบจำลองในประเด็นต่างๆ มากมายอย่างเข้มงวด

ในระหว่างขั้นตอนการฝึกอบรมของ Gemini เครื่องมือต่างๆ เช่น Real Toxicity Prompts กำลังถูกนำมาใช้เพื่อตรวจสอบความปลอดภัยของเนื้อหาและการปฏิบัติตามนโยบายที่กำหนดไว้ เกณฑ์มาตรฐานนี้พัฒนาโดย Allen Institute for AI ประกอบด้วยการแจ้งเตือนระดับความเป็นพิษที่แตกต่างกัน 100,000 รายการที่มาจากเว็บ ข้อมูลเพิ่มเติมเกี่ยวกับโครงการริเริ่มนี้จะสามารถใช้ได้เร็วๆ นี้

Google ได้พัฒนาตัวแยกประเภทความปลอดภัยเฉพาะทางเพื่อลดความเสี่ยง สิ่งเหล่านี้มีหน้าที่รับรู้ ติดป้ายกำกับ และกรองเนื้อหาที่เกี่ยวข้องกับความรุนแรงหรือทัศนคติเหมารวมเชิงลบ เมื่อประกอบกับตัวกรองที่แข็งแกร่ง จะทำให้เกิดกลยุทธ์แบบหลายชั้นที่ออกแบบมาเพื่อเพิ่มความปลอดภัยและการไม่แบ่งแยกของ Gemini นอกจากนี้ ยังมีความพยายามอย่างต่อเนื่องเพื่อรับมือกับความท้าทายที่โมเดลต้องเผชิญ เช่น ข้อเท็จจริง เหตุผล การระบุแหล่งที่มา และการหาหลักฐานยืนยัน

สำหรับ GoPomelo เช่นเดียวกับ Google ความรับผิดชอบและความปลอดภัยยังคงเป็นหัวใจสำคัญของการพัฒนาและปรับใช้โมเดล AI ความมุ่งมั่นอันยั่งยืนนี้จำเป็นต้องสร้างความร่วมมือ ในแนวทางนี้ การมีส่วนร่วมกับอุตสาหกรรมและระบบนิเวศในวงกว้างเป็นสิ่งสำคัญในการสร้างแนวทางปฏิบัติที่ดีที่สุดและเกณฑ์มาตรฐานด้านความปลอดภัย เห็นได้จากการมีส่วนร่วมในแพลตฟอร์มต่างๆ เช่น MLCommons, Frontier Model Forum และ AI Safety Fund และ Secure AI Framework (SAIF) ซึ่งจัดทำขึ้นเพื่อจัดการกับความเสี่ยงด้านความปลอดภัยเฉพาะของ AI ในภาครัฐและเอกชน การเดินทางดำเนินต่อไปด้วยความร่วมมือที่เกี่ยวข้องกับนักวิจัย รัฐบาล และกลุ่มประชาสังคมทั่วโลกในการพัฒนา Gemini

Gemini Safety and responsibility at the core

Making Gemini available to the world

Gemini 1.0 มีแพลนเปิดตัวในผลิตภัณฑ์และแพลตฟอร์มที่หลากหลาย:

Gemini Pro in Google products

Gemini Pro กำลังถูกนำเสนอให้กับพันล้านคนผ่านผลิตภัณฑ์ของ Google Bขณะนี้ Bard ขับเคลื่อนโดย Gemini Pro เวอร์ชันที่ได้รับการปรับแต่งอย่างดี ซึ่งเพิ่มความสามารถในการใช้เหตุผล การวางแผน และความเข้าใจ นี่เป็นการอัปเดตที่สำคัญที่สุดของ Bard นับตั้งแต่เปิดตัว โดยมีให้บริการเป็นภาษาอังกฤษในกว่า 170 ประเทศและดินแดน มีแผนจะขยายไปสู่รูปแบบ ภาษา และสถานที่เพิ่มเติมเร็วๆ นี้

Pixel 8 Pro ซึ่งเป็นสมาร์ทโฟนเครื่องแรกที่ออกแบบมาเพื่อใช้งาน Gemini Nano กำลังนำเทคโนโลยีนี้มาใช้ ฟีเจอร์ต่างๆ เช่น สรุปในแอป Recorder และสมาร์ทรีพลายใน Gboard ที่เริ่มต้นด้วยการรวม WhatsApp นั้นขับเคลื่อนโดย Gemini Nano คาดว่าจะขยายไปยังแอปส่งข้อความเพิ่มเติมในปีหน้า

ในอีกไม่กี่เดือนข้างหน้า Gemini จะถูกรวมเข้ากับผลิตภัณฑ์และบริการอื่นๆ ของ Google รวมถึงการค้นหา โฆษณา Chrome และ Duet AI ปัจจุบัน Gemini กำลังได้รับการทดสอบในการค้นหา ซึ่งจะช่วยเพิ่มประสิทธิภาพ Search Generative Experience (SGE) โดยลดเวลาในการตอบสนองลง 40% สำหรับการค้นหาภาษาอังกฤษในสหรัฐอเมริกา พร้อมด้วยการปรับปรุงคุณภาพ

Building with Gemini

ตั้งแต่วันที่ 13 ธันวาคม นักพัฒนาและลูกค้าองค์กรจะสามารถเข้าถึง Gemini Pro ผ่านทาง Gemini API ใน Google AI Studio หรือ Google Cloud Vertex AI Google AI Studio เป็นเครื่องมือบนเว็บสำหรับการสร้างต้นแบบและการเปิดตัวแอป ช่วยให้เข้าถึงได้ง่ายด้วยคีย์ API Vertex AI นำเสนอแพลตฟอร์ม AI ที่มีการจัดการเต็มรูปแบบพร้อมตัวเลือกการปรับแต่งสำหรับ Gemini โดยผสมผสานการรักษาความปลอดภัย ความเป็นส่วนตัว และการกำกับดูแลข้อมูลระดับองค์กรของ Google Cloud

นักพัฒนา Android จะได้ใช้ Gemini Nano บนมือถือผ่าน AICore ซึ่งเป็นความสามารถระบบใหม่ใน Android 14 ซึ่งเปิดตัวบนอุปกรณ์ Pixel 8 Pro ตัวอย่าง AICore ก่อนใครพร้อมให้ลงทะเบียนแล้ว

Gemini Ultra coming soon

สำหรับ Gemini Ultra นั้น การประเมินความน่าเชื่อถือและความปลอดภัยอย่างละเอียด รวมถึงการทดสอบจากฝ่ายภายนอก (external red-teaming)  ร่วมกับการปรับแต่งโมเดลผ่าน fine-tuning และการเรียนรู้การเสริมกำลังจากความคิดเห็นของมนุษย์ (RLHF) ลูกค้า นักพัฒนา พันธมิตร และผู้เชี่ยวชาญด้านความปลอดภัยและความรับผิดชอบที่ได้รับการคัดเลือก จะสามารถเข้าถึง Gemini Ultra เพื่อรับข้อเสนอแนะก่อนเปิดตัว ก่อนที่จะเผยแพร่ในวงกว้างแก่นักพัฒนาและลูกค้าองค์กรในปีหน้า

นอกจากนี้ Bard Advanced มีกำหนดเปิดตัวในต้นปีหน้า โดยนำเสนอประสบการณ์ AI ขั้นสูงพร้อมการเข้าถึงโมเดลและความสามารถระดับสูง โดยเริ่มด้วย Gemini Ultra

The Gemini era: enabling a future of innovation

สิ่งนี้แสดงให้เห็นถึงความสำเร็จครั้งสำคัญในการพัฒนา AI ซึ่งเป็นจุดเริ่มต้นของยุคใหม่ที่นวัตกรรมที่รวดเร็วและการพัฒนาขีดความสามารถของโมเดลอย่างมีความรับผิดชอบเป็นจุดสนใจหลัก

ด้วยความพยายามอย่างต่อเนื่องเพื่อเพิ่มขีดความสามารถในเวอร์ชันต่อๆ ไป ซึ่งรวมถึงความก้าวหน้าในการวางแผนและการจดจำ ตลอดจนการขยายหน้าต่างบริบทเพื่อประมวลผลข้อมูลในปริมาณที่มากขึ้น ซึ่งจะช่วยปรับปรุงคุณภาพการตอบสนอง 

ศักยภาพของโลกที่ขับเคลื่อนด้วย AI อย่างมีความรับผิดชอบนั้นน่าตื่นเต้นอย่างแท้จริง อนาคตนี้ซึ่งขับเคลื่อนด้วยนวัตกรรม พร้อมที่จะขยายความคิดสร้างสรรค์ ขยายความรู้ ขับเคลื่อนความก้าวหน้าทางวิทยาศาสตร์ และเปลี่ยนแปลงชีวิตและการทำงานของผู้คนหลายพันล้านคนทั่วโลก