เจริญพร เรื่องการตัดคำ

เริ่มโพสต์โดย konnarak, 09 ก.ย. 2012, 15:22 น.

0 สมาชิก และ 1 บุคคลทั่วไป กำลังเปิดอ่านโพสต์นี้

konnarak

เจริญพรโยมๆทั้งหลาย อาตมาใครจะถามโยมๆผู้รู้ดังนี้
1. เรื่องโปรแกรมตัดคำ (ภาษาไทยธรรม) เนื่องจากอาตมาใช้โปรแกรม Indesign ในการพิมพ์งานทั่วไป ก็ใช้ได้ดี แต่มีปัญหาในการตัดคำ เพราะภาษาไทยธรรมมีลักษณะการพิมพ์ติดๆกันไปเหมือนภาษาไทย และโปรแกรมนี้ ก็ตัดคำโดยคิดเป็นคำๆเหมือนภาษาอังกฤษ เนื่องด้วยภาษาไทยธรรมยังไม่มีโปรแกรมตัดคำ จึงมีปัญหามากในการพิมพ์ และจัดเรียงแถว จึงขอท่านผู้รู้เสนอแนะด้วย
2. เราสามารถเขียน sclip เรื่องการตัดคำลงในฟอนต์ได้เลยไหม เหมือนแทนที่ด้วยคำสั่ง liga
3. หรือ จะทำได้โดยประการใด ก็ขอคำแนะนำด้วย...เจริญพร

Layiji

script สำหรับตัดคำในตัว font เลยคงไม่มีครับ
อาจจะแก้ด้วยวิธีดั้งเดิมคือเคาะ space เอาในจังหวะที่เหมาะสมครับ

การตัดคำเป็นเรื่องที่ผ่านมาสิบปีแล้วก็ยังเป็นปัญหาที่ยากอยู่ครับ
ยังคงต้องพี่งพาโปรแกรมเสริมจริงๆ
นักเขียนการ์ตูนรายปี

Leo Charisma

ต้องทำฐานข้อมูล Dictionary เฉพาะครับ ใช้ตัดคำโดยตรง
เปลี่ยนแนวคิดเพื่อการใช้ Typography ให้ถูกต้องตามหลักสากล

konnarak

เจริญพร...
ทำจากฐานข้อมูลโดยตรง อาตมายังมืดแปดด้านเลย...พอจะแนะนำเพิ่มสักหน่อยได้ไหม....

Leo Charisma

#4
ใช้ Input แบบไหนครับ ใช้ เทมเพลต Unicode ช่วงภาษาไทย หรือเปล่าครับ ??
เพราะถ้าใช้ฟอนต์ที่เป็นเทมเพลตภาษาไทย ใน Indesign CS4 ขึ้นไป
จะใช้วิธีการตัดคำอย่างหยาบๆ ด้วยระบบ Proximity
http://www.proximitytechnology.com/languages.htm
กับแบบ Hunspell ที่เป็น Opensource (ใช้ Logic ของการสะกดคำ พยัญชนะ + สระ + วรรณยุกต์ + ตัวสะกด)
ไม่แน่ใจว่าภาษาไทยธรรมใช้ Style การ Input ที่คล้ายๆ กับภาษาไทยหรือเปล่า

แต่ถ้าจะให้สะกดได้แม่นยำกว่านั้นต้องอาศัย Dictionary ครับ ซึ่งของภาษาไทยเอง เห็นมีแบบนี้นะครับ
ไม่รู้ว่าเอามาใช้กับ InDesign จะได้ผลลัพท์ดีแค่ไหน  :16: :16: :16:
http://extensions.services.openoffice.org/en/dictionaries
http://cdnetworks-kr-1.dl.sourceforge.net/project/aoo-extensions/2365/0/dict-th.oxt

ส่วน Hyphenation หรือการใส่ยัติภังค์เผื่อเลือก (Soft-hyphen) ของภาษาไทยเอง ก็ยังสรุปไม่ได้ว่าจะใช้หลักการอย่างไร

ดูเพิ่มเติม http://helpx.adobe.com/indesign/kb/add_cs_dictionaries.html
เปลี่ยนแนวคิดเพื่อการใช้ Typography ให้ถูกต้องตามหลักสากล

Leo Charisma

#5
ผมทำตาม
http://help.adobe.com/en_US/indesign/cs/using/WSa285fff53dea4f8617383751001ea8cb3f-6f53a.html#WSa285fff53dea4f8617383751001ea8cb3f-6f4ca
เพื่อเพิ่มภาษาไทยลงไปในเมนูของ InDesign CS6

*** สำหรับ CS 5.5
http://blogs.adobe.com/typblography/2011/11/how-to-enable-more-languages-in-indesign-cs5-5.html

ไฟล์ : https://dl.dropbox.com/u/29442955/dict-th.zip





การตัดคำ ช่วยได้ระดับที่ถือว่าดีมากแล้ว (ไม่ต่างจากก่อนลงภาษาไทยเท่าไร)
เฉพาะบางคำที่มันตัดตกบรรทัด เราก็ต้องใช้คำสั่ง no break เพื่อให้มันติดกันอยู่ดีครับ


ข็อเสีย : เปลี่ยนเลขอารบิกเป็นเลขไทยไปซะงั้น


ฟีเจอร์ Dictionary


ถ้าภาษาไทยธรรมใช้หลักการแบบภาษาไทยมาตรฐานก็น่าจะได้ผลเหมือนกัน
แต่ต้องใช้ฟอนต์ในเท็มเพลตของภาษาไทยมาตรฐาน และสะกดคำเหมือนๆ กันด้วยนะครับ

ใครทำได้ ไม่ได้ ยังไงมาบอกกล่าว หรือมาถามกันได้ครับ  :12:
เปลี่ยนแนวคิดเพื่อการใช้ Typography ให้ถูกต้องตามหลักสากล

konnarak

เจริญพร ที่โยมๆทั้งตอบมาต้องขอขอบคุณมาเลยโยม..
ภาษาไทยธรรม เป็นภาษาที่มีหลักการพิมพ์ที่แตกต่างจากภาษาไทย และมี Unicode เป็นของตนเองด้วย ที่อาตมาทำฟอนต์ไทยธรรมก็คือ สร้างขึ้นมาใหม่ไม่ได้ใช้เทมเพลตภาษาไทย แต่ใช้สร้างในล๊อกของไทยธรรมเลย แน่นอนว่าไม่สามารถพิมพ์ได้ อาตมาก็ทำคีย์บอร์ดอินสตอร์เข้าไปอีกอันหนึ่ง และปรากฎออกมาที่ทาสบาร์ เพื่อให้มันพิมพ์ได้ และก็ทำได้ดี แต่ปัญหาตรงที่ว่า มันไม่อาจตัดคำได้ จะทำอย่างไรให้สามารถตัดคำได้ หรือ จะทำโปรแกรมเสริม หรืด พจนานุกรมอย่างไร ที่จะเอาไปใช้กับกับ indesign ได้ นี่คือปัญหาอย่างใหญ่หลวง สำหรับอาตมา ..ถ้าพูดถึงเขียนโปรแกรมละก็ มึดมนอนธกาลไปหมด...เจริญพร..

Leo Charisma

นั่นสิครับ ดังนั้นต้องมีคนพัฒนาระบบสะกดคำของภาษาที่ว่าก่อนครับ รวมถึงพจนานุกรมด้วย ระบบตัดคำจึงจะสามารถทำงานได้ครับ จากลิ้งค์ที่ผมให้ไป ไม่พบภาษาที่ว่า ใช่ไหมครับ
เปลี่ยนแนวคิดเพื่อการใช้ Typography ให้ถูกต้องตามหลักสากล

iannnnn

ใช่ครับ เรื่องนี้มันเป็นเรื่องของโครงสร้างเลย
ไม่ใช่ทำที่ตัวฟอนต์ครับ (ฟอนต์เป็นเพียงหน่วยย่อยที่เอาไว้แสดงผลตัวอักษร)
ที่จริงมีคนไทยที่ทำงานอยู่คนนึง ชื่อคุณเทพพิทักษ์ครับ

http://thep.blogspot.com/

Leo Charisma

#9
อ้างคำพูดจาก: iannnnn เมื่อ 11 ก.ย. 2012, 18:55 น.
ใช่ครับ เรื่องนี้มันเป็นเรื่องของโครงสร้างเลย
ไม่ใช่ทำที่ตัวฟอนต์ครับ (ฟอนต์เป็นเพียงหน่วยย่อยที่เอาไว้แสดงผลตัวอักษร)
ที่จริงมีคนไทยที่ทำงานอยู่คนนึง ชื่อคุณเทพพิทักษ์ครับ

http://thep.blogspot.com/


แค่อ่านหน้าแรกก็อึ้งเลยครับ เรื่อง GPOS (Glyphs Positioning) GSUB (Glyphs Substitution) เทพจริงๆ คนนี้แหละมั้งที่เป็นเทพแห่งระบบภาษาไทยบนลินุกซ์
เปลี่ยนแนวคิดเพื่อการใช้ Typography ให้ถูกต้องตามหลักสากล

iannnnn

ใช่ครับ คนนี้แหละ ทำวิจัยเรื่องภาษามาต่อเนื่องยาวนานมากครับ

Leo Charisma

http://thep.blogspot.com/2011/07/esaan-tham-font-with-gsub.html
เห็นเค้าพูดถึงเรื่องอักษรธรรม และระบบการสะกดคำไว้ด้วย
เปลี่ยนแนวคิดเพื่อการใช้ Typography ให้ถูกต้องตามหลักสากล

unexists

ก็เลย ต้องมี อาชีพ " พิสูจน์อักษร" รึเปล่าคะ ????

SMF 2.1.7 © 2026, Simple Machines