P.M. ComTech

P.M. ComTech

แชร์

ขายสินค้าและบริการเกี่ยวกับอุปกรณ์คอมพิวเตอร์ ระบบซอฟต์แวร์คอมพิวเตอร์ ระบบตรวจสอบการกระทำความผิดทางจราจร และรับให้คำปรึกษาด้านการติดตั้งและจัดการระบบเครือข่ายอินเทอร์เน็ต

27/08/2025

เปรียบเทียบการ generate รูปภาพระหว่าง chatgpt5 และ gemini เนื่องจาก ChatGPT-5 ยังไม่มีการประกาศและวางจำหน่ายอย่างเป็นทางการจาก OpenAI ณ ปัจจุบัน (ปี 2024) จึงยังไม่มีบทความใด ๆ ที่เปรียบเทียบการสร้างรูปภาพระหว่าง ChatGPT-5 กับ Gemini โดยตรงจากแหล่งข่าวที่น่าเชื่อถือ

อย่างไรก็ตาม **ChatGPT รุ่นปัจจุบัน (สำหรับผู้ใช้งาน Plus และ Enterprise)** ได้ผนวกความสามารถในการสร้างรูปภาพผ่าน **DALL-E 3** เข้ามาแล้ว ในขณะที่ **Google Gemini** ก็มีความสามารถในการสร้างรูปภาพผ่านโมเดลสร้างภาพของ Google เช่น **Imagen** หรือที่เรียกว่า "Image Generation" หรือ "Text-to-Image" ในส่วนหนึ่งของความสามารถแบบ multimodal ของ Gemini

ดังนั้น เพื่อตอบสนองความต้องการของคุณอย่างใกล้เคียงที่สุด ผมจะนำเสนอบทความที่เกี่ยวข้องกับ **DALL-E 3 (ซึ่งใช้ใน ChatGPT) และ Google Gemini** โดยเน้นบทความที่กล่าวถึงความสามารถในการสร้างหรือจัดการรูปภาพ และสรุปเนื้อหาเปรียบเทียบจากข้อมูลที่มีอยู่

---

# # # **บทความที่เกี่ยวข้องกับการเปรียบเทียบความสามารถในการสร้างรูปภาพของ DALL-E 3 (ผ่าน ChatGPT) และ Gemini**

เนื่องจากยังไม่มีบทความที่เปรียบเทียบ *ChatGPT-5* โดยตรง ผมจึงจะนำเสนอข้อมูลจากบทความที่เกี่ยวข้องกับ *DALL-E 3* (ซึ่งคือเครื่องมือสร้างภาพของ ChatGPT) และ *Gemini* โดยตรง และสร้างสรุปการเปรียบเทียบจากข้อมูลเหล่านั้น

**1. บทความที่เน้น DALL-E 3 (เครื่องมือสร้างภาพใน ChatGPT)**

* **หัวข้อ:** **OpenAI unveils DALL-E 3, its most capable image generator yet**
* **แหล่งที่มา:** TechCrunch
* **วันที่เผยแพร่:** September 20, 2023
* **ลิงก์ต้นทาง:** [https://techcrunch.com/2023/09/20/openai-unveils-dall-e-3-its-most-capable-image-generator-yet/](https://techcrunch.com/2023/09/20/openai-unveils-dall-e-3-its-most-capable-image-generator-yet/)

**สรุปเนื้อหาโดยย่อ:**
บทความนี้เป็นการประกาศเปิดตัว DALL-E 3 โดย OpenAI ซึ่งเน้นย้ำว่าเป็นโมเดลสร้างภาพที่ก้าวหน้าที่สุดเท่าที่เคยมีมาของ OpenAI จุดเด่นคือความสามารถในการเข้าใจและตอบสนองต่อคำสั่ง (prompt) ที่ซับซ้อนและยาวขึ้นได้อย่างแม่นยำยิ่งขึ้น ช่วยลดความจำเป็นในการเขียน prompt ที่ละเอียดมาก ๆ และแก้ไขปัญหาเรื่องการสร้างข้อความในภาพให้ถูกต้องมากขึ้น นอกจากนี้ DALL-E 3 ยังถูกออกแบบมาให้ผนวกเข้ากับ ChatGPT โดยตรง ทำให้ผู้ใช้งานสามารถสนทนาและปรับแต่งภาพที่ต้องการได้อย่างเป็นธรรมชาติและต่อเนื่อง

**2. บทความที่เน้นความสามารถของ Google Gemini (รวมถึงการประมวลผลภาพ)**

* **หัวข้อ:** **Google’s new AI model, Gemini 1.5 Pro, has a much bigger context window**
* **แหล่งที่มา:** The Verge
* **วันที่เผยแพร่:** February 15, 2024
* **ลิงก์ต้นทาง:** [https://www.theverge.com/2024/2/15/24075592/google-gemini-1-5-pro-ai-model-context-window](https://www.theverge.com/2024/2/15/24075592/google-gemini-1-5-pro-ai-model-context-window)

**สรุปเนื้อหาโดยย่อ:**
บทความนี้เน้นไปที่ Gemini 1.5 Pro ซึ่งเป็นโมเดลที่ก้าวหน้าของ Google โดยมี "context window" ที่ใหญ่ขึ้นอย่างมาก ทำให้สามารถประมวลผลข้อมูลจำนวนมหาศาลได้ในครั้งเดียว ทั้งข้อความ รูปภาพ และวิดีโอ แม้บทความนี้ไม่ได้เน้นเฉพาะการ "สร้าง" รูปภาพโดยตรง แต่เน้นความสามารถแบบ multimodal ที่เหนือกว่า โดยเฉพาะการทำความเข้าใจและวิเคราะห์ข้อมูลจากรูปภาพและวิดีโอที่ซับซ้อน ซึ่งเป็นรากฐานสำคัญของความสามารถในการสร้างภาพที่มีคุณภาพสูงและสอดคล้องกับบริบทได้ดีขึ้น โดย Gemini ใช้โมเดล Imagen ในการสร้างภาพ ซึ่งมีจุดเด่นด้านความสมจริงและความหลากหลายในการสร้างรูปแบบภาพ

---

# # # **สรุปการเปรียบเทียบการ Generate รูปภาพระหว่าง DALL-E 3 (ผ่าน ChatGPT) และ Gemini (ผ่าน Imagen/Multimodal)**

จากการศึกษาบทความข้างต้นและข้อมูลสาธารณะเกี่ยวกับความสามารถของทั้งสองแพลตฟอร์ม สามารถสรุปประเด็นเปรียบเทียบการสร้างรูปภาพได้ดังนี้:

1. **ความเข้าใจ Prompt (Text-to-Image):**
* **DALL-E 3 (ผ่าน ChatGPT):** มีจุดเด่นอย่างมากในการทำความเข้าใจคำสั่ง (prompt) ที่ซับซ้อนและยาวได้อย่างละเอียดและแม่นยำ ทำให้ภาพที่ได้ตรงกับจินตนาการของผู้ใช้มากขึ้น นอกจากนี้ การที่ DALL-E 3 ผนวกเข้ากับ ChatGPT ทำให้ผู้ใช้สามารถปรับแต่งภาพผ่านการสนทนาได้ง่ายและเป็นธรรมชาติ
* **Gemini (ผ่าน Imagen):** Gemini โดยรวมมีความสามารถแบบ Multimodal ที่โดดเด่นในการประมวลผลและทำความเข้าใจข้อมูลหลากหลายรูปแบบพร้อมกัน รวมถึงรูปภาพ ซึ่งช่วยให้การสร้างภาพสามารถอ้างอิงจากบริบทที่กว้างขวางขึ้นได้ โมเดล Imagen ที่ใช้ในการสร้างภาพมีชื่อเสียงด้านการสร้างภาพที่สมจริงและมีความหลากหลาย

2. **คุณภาพและความสมจริงของภาพ:**
* **DALL-E 3:** มักจะสร้างภาพที่มีคุณภาพสูง มีความคิดสร้างสรรค์ และมีสไตล์ศิลปะที่หลากหลาย เหมาะสำหรับงานที่ต้องการภาพที่สวยงามและแปลกใหม่
* **Gemini (Imagen):** มีแนวโน้มที่จะสร้างภาพที่มีความสมจริงสูงและหลากหลายสไตล์ เหมาะสำหรับภาพที่ต้องการความแม่นยำในรายละเอียด หรือภาพที่อ้างอิงจากวัตถุจริง

3. **การควบคุมและความปลอดภัย:**
* ทั้งสองแพลตฟอร์มมีการนำมาตรการความปลอดภัยและจริยธรรมมาใช้เพื่อป้องกันการสร้างภาพที่ไม่เหมาะสม อย่างไรก็ตาม ทั้งคู่ก็ยังคงเป็นเทคโนโลยีที่กำลังพัฒนาและอาจพบข้อจำกัดหรือปัญหาเรื่องความถูกต้องหรืออคติได้ในบางกรณี (เช่น ประเด็นการสร้างภาพคนของ Gemini ที่เคยเกิดขึ้น)

4. **การบูรณาการและการใช้งาน:**
* **DALL-E 3:** บูรณาการเข้ากับ ChatGPT ได้อย่างราบรื่น ทำให้การสร้างและปรับแต่งภาพเป็นส่วนหนึ่งของการสนทนา และสามารถใช้ได้โดยตรงจากอินเทอร์เฟซของ ChatGPT Plus/Enterprise
* **Gemini:** ถูกออกแบบมาเพื่อเป็นโมเดล Multimodal ที่ใช้งานได้หลากหลายข้ามแพลตฟอร์มของ Google ซึ่งหมายความว่าความสามารถในการสร้างภาพจะถูกผนวกรวมเข้ากับแอปพลิเคชันและบริการต่าง ๆ ของ Google ทำให้มีความยืดหยุ่นในการใช้งานในบริบทที่แตกต่างกัน

โดยสรุปแล้ว DALL-E 3 ใน ChatGPT โดดเด่นที่ความเข้าใจ prompt ที่ลึกซึ้งและการสร้างสรรค์ภาพสไตล์ศิลปะ ในขณะที่ Gemini โดดเด่นด้วยความสามารถแบบ Multimodal ที่ครอบคลุมและความสมจริงของภาพที่สร้างผ่านโมเดล Imagen ซึ่งเป็นส่วนหนึ่งของระบบนิเวศ AI ที่กว้างขวางกว่าของ Google

---

# # # **ลิงก์ต้นทางของบทความและลิงก์ที่เกี่ยวข้อง**

**บทความหลัก:**

1. **DALL-E 3 Focus:**
* **ชื่อบทความ:** OpenAI unveils DALL-E 3, its most capable image generator yet
* **ลิงก์:** [https://techcrunch.com/2023/09/20/openai-unveils-dall-e-3-its-most-capable-image-generator-yet/](https://techcrunch.com/2023/09/20/openai-unveils-dall-e-3-its-most-capable-image-generator-yet/)
* **แหล่งที่มา:** TechCrunch
* **วันที่:** September 20, 2023

2. **Gemini Focus:**
* **ชื่อบทความ:** Google’s new AI model, Gemini 1.5 Pro, has a much bigger context window
* **ลิงก์:** [https://www.theverge.com/2024/2/15/24075592/google-gemini-1-5-pro-ai-model-context-window](https://www.theverge.com/2024/2/15/24075592/google-gemini-1-5-pro-ai-model-context-window)
* **แหล่งที่มา:** The Verge
* **วันที่:** February 15, 2024

**ลิงก์บทความที่เกี่ยวข้อง:**

1. **DALL-E 3 Integration with ChatGPT:**
* **ชื่อบทความ:** DALL-E 3 is now available to all ChatGPT Plus subscribers
* **ลิงก์:** [https://techcrunch.com/2023/11/06/dall-e-3-is-now-available-to-all-chatgpt-plus-subscribers/](https://techcrunch.com/2023/11/06/dall-e-3-is-now-available-to-all-chatgpt-plus-subscribers/)
* **แหล่งที่มา:** TechCrunch
* **วันที่:** November 6, 2023
* **หมายเหตุ:** บทความนี้กล่าวถึงการผนวกรวม DALL-E 3 เข้ากับ ChatGPT ซึ่งเป็นส่วนสำคัญในการใช้งาน

2. **General Gemini Launch & Capabilities:**
* **ชื่อบทความ:** Google’s new Gemini chatbot is here, and it’s a big deal
* **ลิงก์:** [https://www.theverge.com/2023/12/6/23990664/google-gemini-ai-chatbot-bard-release-date](https://www.theverge.com/2023/12/6/23990664/google-gemini-ai-chatbot-bard-release-date)
* **แหล่งที่มา:** The Verge
* **วันที่:** December 6, 2023
* **หมายเหตุ:** บทความนี้เป็นการเปิดตัว Gemini ในภาพรวม ซึ่งรวมถึงความสามารถแบบ multimodal ที่เป็นรากฐานของการประมวลผลภาพ

3. **Challenges in AI Image Generation (relevant to both):**
* **ชื่อบทความ:** The Messy Fight to Make AI Image Generators Less Racist and Sexist
* **ลิงก์:** [https://www.wired.com/story/ai-image-generators-less-racist-sexist/](https://www.wired.com/story/ai-image-generators-less-racist-sexist/)
* **แหล่งที่มา:** Wired
* **วันที่:** February 27, 2024
* **หมายเหตุ:** บทความนี้กล่าวถึงประเด็นปัญหาด้านจริยธรรมและอคติในการสร้างภาพด้วย AI ซึ่งเป็นความท้าทายที่ทั้ง OpenAI (DALL-E 3) และ Google (Gemini/Imagen) ต่างเผชิญและพยายามแก้ไข

ต้องการให้ธุรกิจของคุณ ธุรกิจ ขึ้นเป็นอันดับหนึ่ง บริการคอมพิวเตอร์และอุปกรณ์อิเล็กทรอนิกส์ ใน Phitsanulok?
คลิกที่นี่เพื่อเป็นสมาชิก?

เว็บไซต์

ที่อยู่


56/12 หมู่ 7 ต. วัดจันทร์ อ. เมือง
Phitsanulok
65000