چهارچوب مبدل یونیکد به فارسی لاتک
از لحاظ چهارچوبی ساختار فایل ورودی میتواند دو دستور زیر را برای راحتی کار مبدل فراهم کند:
-
زبان پیش-فرض: صرفا به یک دستور نیاز دارد.
-
قطعهای که در آن زبان صریحا مشخص شده است: این قطعه با دو زیر-دستور شروع قطعه و پایان قطعه مشخص میگردد.
در دستور اول میتوان زبان دیگری به کار برد و مبدل تا جای ممکن به صورت هوشمند عمل میکند (البته قواعد این هوشمندی باید مشخص باشد). در پستهای بعدی این قواعد بیشتر بحث میشوند و از خوانندگان تقاضا دارم در این زمینه کمک کنند.
در درون قطعهای که با دستور دوم مشخص میشود، مبدل نباید هیچگونه هوشمندی به کار ببرد.
با فرض اینکه نیازی به تبدیل یونیکد به تک پارسی و سپس مجددا از تک پارسی به یونیکد نیست، لذا نیازی به خاصیت زیر نیست.
خاصیت مطلوب دیگری که به ذهنم میرسد قابلیت نگاشت یک به یک بین یونیکد و کد مقصد است. مثلا کد تک پارسی نویسه مستقیم یای عربی را ندارد. برای نگاشت یای عربی در حالت متصل از دو طرف میتوان از نویسه یای فارسی استفاده کرد ولی این کار باعث میشود که هنگام نگاشت از تک پارسی به یونیکد خروجی از لحاظ مفهومی غلط باشد (هر چند که از لحاظ ظاهری درست است).