Copyright © 2015 W3C® (MIT, ERCIM, Keio, Beihang). W3C liability, trademark and document use rules apply.
本文書整理了中文(漢字)書寫系統於排版上的需求。一方面說明需求事項以明確描述中文排版之需求與問題;另一方面也提與既有標準(如萬國碼)的對應,冀求透過本文書能在實作層級更能有效地促進實現。
This section describes the status of this document at the time of its publication. Other documents may supersede this document. A list of current W3C publications and the latest revision of this technical report can be found in the W3C technical reports index at http://www.w3.org/TR/.
W3C国际化工作组 为本文档提供了很多支持。欢迎使用public-i18n-cjk@w3.org (订阅)来进行任何关于本文档的讨论。本文档的第一版工作草稿发布后,W3C HTML5中文兴趣组将于W3C国际化工作组 一起,进一步扩展本文档内容并寻求更广的审阅意见。
欢迎同时查阅本文档的英文(English)版本。
Publication as an Editor's Draft does not imply endorsement by the W3C Membership. This is a draft document and may be updated, replaced or obsoleted by other documents at any time. It is inappropriate to cite this document as other than work in progress.
本文档遵循W3C 2004-02-05 专利政策. W3C maintains a public list of any patent disclosures made in connection with the deliverables of the group; that page also includes instructions for disclosing a patent. An individual who has actual knowledge of a patent which the individual believes contains Essential Claim(s) must disclose the information in accordance with section 6 of the W3C Patent Policy.
本文档遵循 2014-08-01 W3C 流程文档.
每一個文化群體都擁有獨自的語言、文字、書寫系統。將個別書寫系統得以在虛擬空間再現,對文化資產的承繼而言,是資訊傳播技術的重要責任。
作為實現這個責任的基礎,本文書整理了中文(漢字)書寫系統於排版上的需求。一方面說明需求事項以明確描述中文排版之需求與問題;另一方面也提供與既有標準(如萬國碼)的對應,冀求透過本文書能在實作層級更能有效地促進實現。
中文排版有別於其他體系,主要特色在於以下各點:
中文排版主要使用的文字為漢字。
依照各地的通行標準,中文所使用的漢字主要又分為繁體字與簡體字。前者又作正體字、傳統漢字等,主要通行於台灣、香港、澳門等地;後者又作簡化字,主要通行於中國大陸、星馬地區。本文依筆畫多寡與部件結構為區別,統稱為繁體字與簡體字。
漢字區分繁簡者,在萬國碼中使用各別的碼位;無繁簡之別的漢字稱作傳承字,在萬國碼中不區分碼位。然而,一個傳承字在各地區的字形標準中可能有不同的寫法,這些傳承字在萬國碼中多不區分,使用相應的字體方能呈現其差異,但有少數例外(如,戶户等)區分碼位。本文主要探究中文排版,對此不做詳述。
中文排版除了漢字外,也使用標點符號。也會與阿拉伯數字、拉丁文字、希臘文字等外文混排。
一個簡體字可能對應多個繁體字,如簡體字「发」對應繁體字「發」與「髮」。
漢字有著正方形的文字外框。於文字外框的正中央,有著比文字外框小的字面(反過來說,字面的上下左右與文字外框之間,有稍微比字面大的若干空白)。中文標點符號的尺寸多與漢字一致,寬高相等,部分標點(如刪節號等)則佔用一個漢字高、二個漢字寬的大小。
文字尺寸則為文字外框的尺寸。此外,字幅則是依照文字排列方向的文字外框大小,為文字的寬度。漢字的外框為正方形。
漢字依行排列文字,原則上文字外框彼此緊貼配置。
從活字排版時代起,漢字無論直、橫文字外框彼此緊貼配置適於閱讀。但活字排版依照文字尺寸不同,各號數之字型原模不同,字面也隨之不同。目前數位字體僅採取單一原型,當文字尺寸放大時,有時需要調整字距。然而,中文漢字字體面率一般較日文字體小,除非在特殊狀況下,不需特別處理。另當文字尺寸縮小時,若為向量字體,則需要補正資訊來調整文字線幅;但有部分字體在文字尺寸較小時,會以點陣字體呈現,此時就不需另外調整。
依照內容的不同,也會採用以下方式排列:
於各字之間加入固定量的空白來排列文字。書籍排版上,遇到以下狀況時,會採用此排列方式:
平均分配字距,使文字列兩端能夠對齊行首與行尾。中文排版時,由於使用的漢字與標點符號皆為正方形,自然會使得文字列對齊行首與行尾。該種排列方式,主要應用於:
減少字與字間的字距,使得文字外框一部份重疊。這種處理方式,主要應用於:
中文排版時,主要使用的四種字體為:
這四種字體於書籍排版上有其常見之使用方式,下列各節分別敘述其使用情境。
宋體,又稱為明體或明朝體,是中文排版最常使用之字體。
普遍使用於內文文字、標題與註解。當應用於標題時,通常會特別加強字重,令其與內文有所差異。
楷體為帶有書法形態、手寫筆觸之字體。
主要使用於標題、引言、摘句、對話、內容出處等,與內文有所不同的段落上。但因為與宋體近似,故少用於強調。
由於楷體保留了書法筆觸,普遍用於公文書、教科書之內文字。
黑體主要應用於標題、圖說、對話之人名。內文中也會使用字重較粗的黑體作為特定文字的強調、著重。
傳統印刷品少有使用黑體作為內文文字者,但受到萬維網、數位出版的影響,也有少數書籍開始使用黑體作為內文字體。
仿宋體的字體形態介於宋體與楷體之間。常用於引言、摘句等與內文區隔的段落上。
中文書籍排版依以下順序設計:
書籍多數僅使用一種基礎排版體裁,雜誌則會使用上數種。
但儘管書籍僅使用一種體裁,在實際頁面的設計上,如:目錄、索引等頁面,會基於基本排版體裁重新設計。索引等頁面採用不同排版體裁設計的案例也相當多,直排書索引也會以橫排或者多欄排版方式設計。但在設計上,版面尺寸等依然不出基礎排版體裁。
雜誌則因為內容不同,排版體裁多變,文字大小、欄數依照內容不同會有所變化。
基礎排版體裁的主要元素如下:
決定版心除了在頁面中設定長方形的空間外,也有著供內文、標題、圖片配置做為基準的格子設定。其格子設定於中文排版原則下,內文必須依照格子進行配置。在文章僅由漢字構成的狀況下,行首、行尾對齊版心邊界是中文書排版重要的原則。但在與西文混排、或配置標點禁則處理時,為遵從本項原則,內文可不按照格子排列。
作為書籍基本設計而成的排版體裁稱為版心,版心的設計元素如下:
本部分說明如何以版心作為基本排版體裁來設計各頁面。
決定版心尺寸
決定相對於印刷版面,版心的配置位置。版心配置位置的設計順序有著以下方式。
一般而言,版心多置放於印刷版面的的正中央,然後依照版心尺寸不同,向上下、左右調整。這種設計方式主要承襲自活字印刷,但於桌上排版,則多以印刷版面計算與版心尺寸四方邊界之差為之。
版心於設計時需考量以下事項:
以成人為讀者製作書籍時,文字尺寸一般為10.5pt(≒3.7mm)與9pt(≒3.2mm)為多。除了特殊書籍外,最小也要有8pt(≒2.8mm)。
中文活字尺寸以「號」為單位,又分新舊兩種寸法。可完整對應美制的「點(Point, pt)」,分別如下:初號=42pt、一號=27.5pt、二號=21pt、三號=15.75pt、四號=13.75pt、五號=10.5pt、六號=7.875pt、七號=5.25pt。新五號四行=36pt、新一號=24pt、新二號=18pt、新三號字=16pt、新四號=12pt、新五號=9pt註2)一般內文主要使用五號字(10.5pt≒3.7mm),而報紙、雜誌則使用新五號字(9pt≒3.2mm),兩種皆常為使用。而一般內文字最小使用到六號字(7.875pt≒2.8mm),若小於此尺寸,由於漢字結構複雜,則難以閱讀。
1行的行長應為文字尺寸的整數倍,各行的位置盡可能頭尾對齊。
中文在不與西文混排的狀況下,所使用的文字外框皆為正方形,除段落最後一行不對齊外,各行行首、行尾皆需對齊,這是重要的排版原則。
行與行之間的空白(行距)除特別狀況外,皆需保持一致。
傳統字會於行距間放置注音符號、翻譯書籍亦可能如日文排版一般加入Ruby文字,此時行距依然需保持一致。當文書需要配置這些元素時,於設計版心之階段就須考量到這些要素來決定行距。
版心之行距多半介於文字尺寸之50%~100%之間,當行長較短、或文字尺寸較小時,行距設定也會相對較小。反之,行距一般不會超過文字尺寸,就算超過文字尺寸,也不會因而增加易讀性。
指定版心的方法中,有著不以行距,而是依行高(line-height)來設定的方法。行高就是彼此鄰接的兩行的基準點到基準點之間的距離。基準點依照處理方式而會有所不同,直排時行左右的中央線,橫排時為行上下的中央線。當配置的文字全部尺寸相同時,有著以下關係。行高=文字尺寸÷2+行距+文字尺寸÷2=文字尺寸+行距行距=行高-文字尺寸。
中文標點符號的排版在各地區有不同的處理方式,其中較顯著的差異係其字面分布——繁體中文多使用符號居中的字形樣式,而簡體中文多使用符號尾隨受注文字末端的字形樣式,並依直、橫排有不同的處理。下文將詳述繁、簡中文標點的異同及準確的配置方式。
在繁、簡中文排版中,標點符號的字面分布與形態差異為二者主要的分歧點(詳見3.2.2節)。進行版式配置時,需要多加留意。
中日韓越意音文字標點符號有地區上的字形與形態差異,但萬國碼並未對其區分字碼,繁、簡中文及日文等標點多有共用。通常,排版時使用相應的字體進行配置,或由排版引擎自動調適。
句號[。](IDEOGRAPHIC FULL STOP)、逗號[,](FULLWIDTH COMMA)以及頓號[、](IDEOGRAPHIC COMMA)。句號表示語句結束、逗點表示語氣停頓、頓號使用於並列連用、表示次序的字詞之間。
冒號[:](FULLWIDTH COLON)、分號[;](FULLWIDTH SEMICOLON)。冒號表示引述語句開始;分號用於語句間,表示意義轉折。
驚嘆號[!](FULLWIDTH EXCLAMATION MARK)與問號[?](FULLWIDTH QUESTION MARK)。驚嘆號及問號用於句末,前者表示驚訝,後者表示質疑。
標號相對於點號,有標示詞組或語句之特定性質的作用。包含引号、括号(夾注號)、破折号、刪節號(省略号)、着重号、连接号、间隔号、书名号、专名号、分隔号。
引號用於強調字詞,或作為引用話語、文獻的起訖邊界。引號中再次使用引號時,使用內引號。外引號與內引號有字形上的差異以便識別。引號屬於括注符號。
繁體中文採用先單、後雙的引號體例。單引號,包含開始單直角引號[「](LEFT CORNER BRACKET)與結束單直角引號[」](RIGHT CORNER BRACKET);雙引號,包含開始雙直角引號[『](LEFT WHITE CORNER BRACKET)與結束雙直角引號[』](RIGHT WHITE CORNER BRACKET)。
簡體中文採用先雙、後單的引號體例,彎引號用於橫排、直角引號用於直排。雙引號,包含開始雙彎引號[“](LEFT DOUBLE QUOTATION MARK)、開始雙直角引號[『](LEFT CORNER BRACKET)、結束雙彎引號[”](RIGHT SINGLE QUOTATION MARK)、結束雙直角引號[』](RIGHT WHITE CORNER BRACKET);單引號,包含開始單彎引號[‘](LEFT QUOTATION MARK)、開始單直角引號[『](LEFT WHITE CORNER BRACKET)、結束單彎引號[’](RIGHT SINGLE QUOTATION MARK)、結束單直角引號[』](RIGHT CORNER BRACKET)。
某些繁體中文出版物亦會採用先雙、後單的引號體例。
繁體中文也有使用彎引號者,但鮮少用於直排。
其餘引號類如:[【](LEFT BLACK LENTICULAR BRACKET)、[】](RIGHT BLACK LENTICULAR BRACKET)、[〖](LEFT WHITE LENTICULAR BRACKET)[〗](RIGHT WHITE LENTICULAR BRACKET)、[〔](LEFT TORTOISE SHELL BRACKET)、[〕](RIGHT TORTOISE SHELL BRACKET)、[[](FULLWIDTH LEFT SQUARE BRACKET)、[]](FULLWIDTH RIGHT SQUARE BRACKET)、[{](FULLWIDTH LEFT CURLY BRACKET)、[}](FULLWIDTH RIGHT CURLY BRACKET),則較少使用於中文書籍。
括號(又作夾注號)用於行內註解、說明。分甲式及乙式,甲式為[(](FULLWIDTH LEFT PARENTHESIS)與[)](FULLWIDTH RIGHT PARENTHESIS),乙式則為一對各佔一個漢字高、二個漢字寬的[—](EM DASH)(或使用連續二個「——」)。括號屬於括注符號。
中國大陸的《標點符號用法》(GB/T 15834–2011)將乙式括號視為破折號的特殊形式。
破折號表示語氣或聲音的延續、語意的轉換或行文的補充。為佔一個漢字高、二個漢字寬的[—](EM DASH)(或使用連續二個「——」)。
刪節號(又作省略號)表示節略原文、語句未完或語氣的不連續。為佔一個漢字高、二個漢字寬,並包含六個省略點的[…](HORIZONTAL ELLIPSIS)(或使用連續二個「……]」)。
着重號用於表示相應文本的強調、着重語氣或避免歧義。其形態為標注於文字底端或頂端(橫排多在下方〔底端〕、直排多在右側〔頂端〕)的圓形中黑點,可以為[●](BLACK CIRCLE)或[•](BULLET)。
台灣教育部的《重訂標點符號手冊》(修訂版)中未收錄此符號,但仍可見於部分繁體中文出版品。
連接號用於連結時空之起訖或數量之多寡。分為甲式及乙式,甲式為[–](EN DASH)、乙式為[~](FULLWIDTH TILDE)或[~](TILDE)。
間隔號為[·](MIDDLE DOT)。用於書名號乙式(雙書名號)分隔篇、章、卷,以及外國人名中文譯名、少數民族音譯名,分隔姓名使用。
間隔號在繁、簡中文間的用法有所不同,原則上繁體中文無論直排或橫排,都佔用一個漢字的大小;簡體中文用於分隔日期(如9·11)等情況時,可用半個漢字的大小。
過去因BIG-5編碼未有詳細的語意定義,所以時有混用[.](Fullwidth Fullstop)、[·](Hyphenation Point)、[•](BULLET)等字元作為間隔號的例子,建議使用[·](Middle dot)。而[・](Katakana Middle Dot)與日文JIS編碼關係較深,也不建議使用。
書名號用於標示書名、篇名、歌曲名、影劇名、文件名、字畫名等各種作品名稱。分為甲式及乙式,甲式為波浪底線[﹏](WAVY LOW LINE),標注在相應文本底端,二個作品名稱相鄰時,甲式書名號間須在視覺上分離予以辨別。乙式有雙書名號[《](LEFT DOUBLE ANGLE BRACKET)與[》](RIGHT DOUBLE ANGLE BRACKET)、單書名號[〈](LEFT ANGEL BRACKET)與[〉](RIGHT ANGEL BRACKET),前者用於標示書名號、後者用於標示篇名。
在二個書名號相鄰時,須在視覺上分離予以辨別。
書名號乙式屬於括注符號。
甲式書名號已甚少出現於現代的出版品,但仍可見於教科書或古籍的標示。
專名號為[_](FULLWIDTH LOW LINE),標示於專有名詞——如人名、地名等——底端之符號。
在二個專有名詞相鄰時,專名號間須在視覺上分離予以辨別。
同甲式書名號,專名號已甚少出現於現代書籍,但仍可見於教科書或古籍的標示。
分隔號為[/](SOLIDUS)、[/](FULLWIDTH SOLIDUS),用於標示詩的分行、音節節拍及相關文字的分隔。
台灣教育部的《重訂標點符號手冊》(修訂版)中未收錄此符號,但繁體中文出版品中多有使用,其中包含教科書。
標點符號的字形及用法請見3.2.1節及附錄A。繁、簡中文的標點符號在字形上未有顯著差異,二者間的區別主要係符號的尺寸與字面分布。
繁體中文標點多位於字面正中,部分標號在直、橫排中使用不同的方向以準確地標注文字;簡體中文標點多位於受注文字的末端、字面始端,部分標號在直、橫排中除了使用不同的方向外,亦有需要因文字書寫方向替換符號形式的需求,如引號(橫排使用彎引號,直排使用直角引號)。
點號,包括:頓號、逗號、分號、冒號、句號、問號、驚嘆號等,佔一個漢字的大小,直、橫排方向一致。繁體中文排版位於字面正中;簡體中文排版則位受注文字末端、字面始端偏頂端或底端一側(橫排時位字面左下角,直排時位字面右上角)。
括注符號,包括:引號、括號、書名號及篇名號(乙式)等,位受注文本的二側,佔一個漢字的大小、依文字書寫方向使用相應的標注方向。其中,引號在繁、簡中文分別採用不同的形式,繁體中文排版多使用先單、後雙(依此類推)的配對形式; 簡體中文排版則使用先雙、後單(依此類推)的配對形式,並依文字書寫方向採用相應的符號(橫排使用彎引號,直排使用直角引號)。
包括:刪節號、破折號等標號,位字面正中,佔一個漢字之高、二個漢字之寬,並不得以適配分行之由拆至二行,依文字書寫方向使用相應的標注方向。
連接號位字面正中,佔一個漢字的大小,其中,甲式連接號在橫排時,符號的直線長度應稍小於漢字「一」以避免歧義,依文字書寫方向使用相應的標注方向。
間隔號位於字面正中,佔一個漢字的大小,直、橫排方向一致。為了節省排版空間、使詞組或數字較緊湊地排列,可以使用半個漢字之寬的間隔號。
包括:專名號、甲式書名號、着重號等標注於行間的標號,位受注文字底端,着重號在直排時位在受注文字頂端(右側),以不影響上下行文字為原則。
分隔號位字面正中,簡體中文排版時佔半個漢字的大小;繁體中文通行地區未有相關的規定,但多數出版品多使用一個漢字的大小。
科技文獻中的「句號」多使用[.](FULLWIDTH FULL STOP)替代[。](IDEOGRAPHIC FULL STOP),以避免同拉丁字母「o」或數字「0」混淆。
在繁體中文的古籍、科技文獻、科學類教科書或常引西文的書籍中,亦可見使用位受注文字末端、字面始端的點號(頓號、逗號、句號),類似簡體中文或日文標點符號,以保持中、西文標點體例一致。
為了保持閱讀順暢、體例一致,多數標點符號的位置有其限制,通常一個標點符號依其性質,禁止出現在一行之首或之末。這項規則自活字排版時代開始通行。在中國大陸,《標點符號用法》(GB/T 15834–2011)規定了簡體中文標點在行間的位置;繁體中文通行地區雖未有相應的規範,但多數出版品皆以此處所述規則對標點符號進行配置。
在繁體中文裡,並未嚴格禁止標點符號出現於行首,於活字排版時代,完全不處理標點禁則的出版品也相當多見。
繁體中文出版品中,報紙、雜誌多採分欄式排版,此時由於一行字數較少,也有完全不使用行首行尾禁則的作法。
排版時,若不希望標點符號出現於行頭時,僅能由前行取末字至下一行,前行多出來的空間採平均排列的方式處理。但若遇連續標點符號,如[。』」]等狀況,可能取一字會造成前行字距過大,這時則採寬鬆處理,允許標點出現於行頭,以避免字距過鬆造成體例不良。
包括:點號(頓號、逗號、句號、冒號、分號、驚嘆號、問號)、結束引號、結束括號、結束乙式書名號(篇名號)、刪節號、連接號、間隔號等符號,不得出現於一行之首。
包括:開始引號等、開始括號、開始單雙書名號等符號,不得出現於一行之尾。
以下標點符號佔用二個漢字的空間,在行間應為一體,視作一個字元存在,不得以適配分行之由拆至二行。
若遇到多個標點符號連續排列時,也能准許分割為兩行,如3.2.4節註2所述。若強制禁止分離,將造成前一行字距過大,導致更嚴重的體例不良。
在數字排版時代,這些符號多使用連用二個字元的方式達到佔用二個漢字空間的視覺效果,但語意上仍應視作一個符號。
乙式括號與破折號為佔一個漢字高、二個漢字寬的[—](EM DASH)(或使用連續二個「——」)。
刪節號為佔一個漢字高、二個漢字寬,並包含六個省略點的[…](HORIZONTAL ELLIPSIS)(或使用連續二個「……]」)。
中文的標點符號多佔一個(或以上)漢字的空間,使其在字間易於識別、適合配置及排版。然而,在標點前後不為文字時,標點的空白空間將顯突兀。對標點符號的空餘空間進行擠壓,可使文字體裁更加緊湊、易讀。
標點符號的擠壓通常分為二種——其一,標點符號連續出現時,對符號間相鄰的空隙進行調整;另一種則是符號出現於行首或行尾時,調整該符號字面位置,縮減行首或行尾的空隙。
在開始括注符號、結束括注符號、頓號、逗號、句號及間隔號等連續排列時,以下的空隙調整規則得以使文字體裁更加緊湊、易讀。
標點符號出現在一行之首或之末時,以下的空隙調整規則得以使文字體裁更加緊湊、易讀。
絕多數的中文出版品沒有懸掛行尾點號的慣例。參考日文排版的做法,點號懸掛是行首標點禁則處理方式的延伸,可以避免文字及點號在前後行的移動,甚而導致前行字距不一的問題。
通常,適合行尾懸掛的點號有頓號、逗號及句號三者。簡體中文排版中,其餘點號因其字面分布偏向受注文字一側、字面始端,亦可進行行尾懸掛配置。
若點號(頓號、逗號或句號)將出現於一行之首,可將其置於前一行的行尾端、突出版心。
然而,由於繁體中文的點號位於字面正中,若在橫排時使用行尾懸掛,體例可能顯得突兀、不良。故橫排時,繁體中文不做行尾懸掛配置;但可用於直排。
連續多個標點符號的情況下,不作行尾點號懸掛的配置。
中文排版中,漢字與拉丁字母、希臘字母或阿拉伯數字等西文混排的狀況經常出現,以下列舉部分範例。
項目符號與標題編號、單位符號、元素符號、數學符號等也多有西文,由此可知,日常使用上中、西文的混排非常常見。
若無特別提示,本文使用之「阿拉伯數字」皆指西方語言或歐洲形式的印度-阿拉伯數字。
過去,因計算機排版技術不甚精良,多使用「全形ASCII字元」以達整齊等視覺排版效果。現今在文本儲存時,應避免使用該區段之拉丁字母及數字字元,交由排版引擎處理比例字體、等寬字體等顯示需求。
橫排時,西文使用比例字體,阿拉伯數字亦然。原則上,漢字與西文字母、數字間使用四分之一個漢字寬的字距或空白。但西文出現在行頭或行尾時,則毋須加入空白。
或可使用西文詞間空格([ ](SPACE),其寬度隨不同字體有所變化)。
直排時,西文與阿拉伯數字的配置有以下三種方法:
直排時多使用漢字數字,然而近年使用西文數字的情況漸有增長,縱中橫排亦頗為常見。
橫排中混排的西文、阿拉伯數字,及直排中將文字採順時針旋轉90度配置的西文、阿拉伯數字,其配置方式如下:
以下情況例外:
由於漢字各字等寬的性質,無論在直排或橫排的情況下,除了行齊頭尾對齊外,亦求各行間的各個漢字能夠縱橫對齊。若遇西文或阿拉伯數字採用比例字體,便難以滿足這項原則,處理方式如下:
縱橫對齊時,可配合3.2.7節的行尾點號懸掛方式處理標點禁則,若遇兩個以上連續標點時,第二個及其後之標點可令其出現於行首。
縱橫對齊多使用於繁體中文排版,簡體中文較為少見。
行间注是标注于字词旁侧的小字号补充文本。行间注的注文通常位于行间,与其所标注的基文对齐,因這一性質而又名為行間注。行间注在中文排版里的用途主要为标音与释义。
行间注最常见的用途係為漢字標注讀音。汉字标音针对的是汉语初学者,包括母语为汉语的幼儿以及学习汉语的外国人士,因此对个别字标音的情况较少,多为全文标音。常规排版中没有行间注标音的习惯,对生僻字也几乎从不标音,即便标音也只是用行内括号注。
中文的标音方案有注音符号与羅馬拼音两大类:
國語注音符號及台灣方言音符號(以下統稱注音或注音符號)標音系統多用於台灣,其他地區僅見於特定的辭典或教科書中。絕大多數的情況下,注音符號標注於相應漢字(基文)的右側,例外情況非常少見。
使用拉丁字母的汉语拼音是中国大陆推行的現代標準漢語(普通话)标音与拉丁转写方案,汉语拼音的全文标音也是中国大陆现代最常见的行间注用例。在中国大陆与台湾,台湾闽南语罗马字拼音等各种汉语方言的拉丁字母标音方案也有与汉语拼音情况类似的行间注用例。
因拉丁字母的特质,此类标音文本仅横排。针对幼儿母语者的文本以单字作为基文进行标音。针对二语学习者的文本除偶有与前者一致的格式外,大多分词连写,以词作为基文进行标音,基文之间如西文书写般用空格隔开,并且注文有句首大写、专名首字母大写等格式以及与正文对应的标点符号,自成一体。汉语拼音早期印刷品的格式较为多变,一致性不强。大体上,单字标音与分词连写标音都常见,不作详细描述。
為外來語、首字母縮略詞標注其中譯,或對翻譯名詞標注其原文,多見於專有名詞、作品名及譯後概念較難傳達的詞彙。常见于译作,尤以轻小说為主。
行間批語是為一段文本片段或單個詞彙標注解釋的排版方式,因共存於正文文本,顯示於其行間而得名。行間批語較眉批、腳注等注釋方法更具緊湊、依附性,多見於如《紅樓夢》早期抄本的脂硯齋批語等古籍。
直排時,注音符號或羅馬拼音、中外文對照常位於受注基文(漢字)右側,行間批語則多位於基文片段左側;橫排時,注音符號可置於受注基文(漢字)的上方及右側,但多見於右側,而羅馬拼音及中外文對照上下皆可,行間批語則位於基文片段的後方。
注音符号等宽且每个汉字标音的注音符号字数不超过三个,较为可控;而拉丁字母非等宽,拼式长短不一,且相邻拼式相连时应当有词间空格隔开。两类标音 ruby 的排版差异较大。
拼注音共同標注是一種可行的作法,能同時為僅熟悉單一標音系統的二種讀者提供漢字標音,並作為學習、査詢另一種系統拼寫的有效方式。一般情況下,「拼注音共同標注」的注音符號位漢字右側,橫排時羅馬拼音位漢字下方,直排時位漢字左側。
根據台灣教育部制訂的《國語注音符號手冊》,將注音符號標注於漢字上方(橫式注音)及右方(直式注音)的二種排版格式皆屬官方標準,但在現今的教科書或其他印刷品中,將注音標注於漢字上方的格式非常罕見,一般大眾也不易接受,因此,無論在直排或橫排中,將注音符號標注在漢字右方都是較佳的作法。
將一個漢字視作寬高相等「30:30」的正方形,其注音符號標示範圍之寬高則應為「15:30」,緊隨其標注的漢字。
聲母、介音、韻母之比例為「9:9」,國語陰陽上去四聲及方言音非入聲調號「5:5」、國語輕聲調號「9:2」、方言音入聲調號「5:5」。詳盡細節及圖例請參考下文「各種發音組合的排版方式」。
正文字號較小時,單獨為注音符號提供字號稍大的字體是可行的作法,亦可考慮其他字音標注方式,如置於正文括號內。
如同標點禁則,直式注音在橫排文本中應注意其緊隨漢字的原則,注音標音不得單獨出現在行首,而需永遠緊隨其標注的漢字右側。
注:这一排版需求有赖于 HTML Ruby Markup Extensions 对
注:注意底線處結尾及開頭標籤之間包含一個空白。
下文描述两类典型用例之间的差异。
對現代標準漢語的特殊語音現象——兒化,注音符號受制於其標注單個漢字的局限,難以準確表達兒化音節的連續性及韻母變音,需要在正文或附注中額外說明;羅馬拼音則可有效標注此現象。
由於合文「多音節」的特殊性,使用ruby標音可能導致文本排版效果不佳,應改在附注、括號內或於正文中說明其讀音。目前合文已少見於現代中文書寫系統。
中外文對照的排版方式與羅馬拼音標音類似,多位於受注文本片段頂端——直排時位基文右側,橫排時位基文上方。
為了保證詞彙的整體性,在注文總長與其基文的長度不一時,需要調整相互間的對齊關係,以求體例清晰並避免誤會。
當注文總長小於其基文的長度時,將注文設置居中(適用西文)或加大注文字距(適用漢字),後者更有「間隔平均分配」及「始末端對齊」二種方式。
當注文總長大於其基文的長度時,將基文設置居中(適用西文)或加大基文字距(適用漢字)。
注: 底線處詳見〈JLReq・Positioning of Group-ruby with Respect to Base Characters〉一節, JLReq/#positioning_of_groupruby_with_respect_to_base_characters
間批語的格式多變且內容長度不一,通常位於受注的文本片段底端——直排時位基文左側,橫排時位基文下方。為與正文區隔,有時以不同於正文文字的顏色來顯示。
行間批語可用於解釋一段長文本的整體語境。這種情況下,由於沒有明確的基文,其注文常自一個合適的錨點位置展開並向後延伸,長度不拘,時可超過一行。
標題依照排版處理方式,可分為以下三種:
雜誌因為排版需求,標題會使用相當多種多樣的方式處理,但書籍排版較為單純,故不將雜誌使用的標題配置方式列於本文件之中。
全頁為書籍中需要大幅區分時使用,為了標題而使用一整頁,背面為空白。有時還會有副標、摘句、作者名以及圖片、部分段落等元素配置其上。有時也有背面不為空白(即日文書中之半扉)的使用方式。通常在書籍內文開始處,會以扉頁標注書名。
內文標題是以獨立一行呈現標題的作法。於標題後換行,直接接續本文。大標與中標等使用這種形式配置。
標題是為了區分內容而添加,依照階層構造,由上而下分別為扉頁、大標、中標、小標。
扉頁通常指一本書的蝴蝶頁,如果依照放標題順序,依序是:書名頁、章名頁、大標、中標、小標。
標題構造結構為何,依照書籍內容而定。有人認為標題層級不應該過多。
多欄排列時,有著將換行標題置於複數欄的配置方法。稱為「跨欄標題」。
同行標題為標題後接的文章不予換行,而以接續在標題後面繼續排列的形式呈現。同行標題主要利用於小標。此外,小標也會使用換行標題。
標題主要是為了呈現階層結構,所以需要以特別的表現體裁來顯示其階層。標題的表現體裁包含以下幾種方式:
標題為了作出明確區分,而會使用於新頁面開始的方法,此時以以下原則處理:
單頁起、換頁處理時,前一頁的排版處理會是問題(最終頁的處理亦同),以以下原則處理:
同行標題主要用於小標,以下介紹幾個同行標題的配置範例。同行標題與之後接續內文的空白量,一般為版心設定文字尺寸的全形空白。此外,同行標題可以配置於頁末。
名稱 | 圖例 | Unicode | 說明 | 直排時旋轉90度 | 禁止出現於行首(繁體字) | 禁止出現於行首(簡體字 | 禁止出現於行尾(繁體字) | 禁止出現於行尾(簡體字) | 不可分離 | ||
句號 | 。 | U+3002 | IDEOGRAPHIC FULL STOP | 否 | 是 | 是 | 否 | 否 | |||
逗號 | , | U+FF0C | FULLWIDTH COMMA | 否 | 是 | 是 | 否 | 否 | |||
頓號 | 、 | U+3001 | IDEOGRAPHIC COMMA | 否 | 是 | 是 | 否 | 否 | |||
冒號 | : | U+FF1A | FULLWIDTH COLON | 否 | 是 | 是 | 否 | 否 | |||
分號 | ; | U+FF1B | FULLWIDTH SEMICOLON | 否 | 是 | 是 | 否 | 否 | |||
驚歎號 | ! | U+FF01 | FULLWIDTH EXCLAMATION MARK | 否 | 是*1 | 是 | 否 | 否 | 三驚嘆號疊用時應佔二字寬 | ||
‼ | U+203C | 否 | 是 | 是 | 否 | 否 | 應佔全形字寬 | ||||
問號 | ? | U+FF1F | FULLWIDTH QUESTION MARK | 否 | 是*1 | 是 | 否 | 否 | 三問號疊用時應佔二字寬 | ||
⁇ | U+2047 | DOUBLE QUESTION MARK | 否 | 是*1 | 是 | 否 | 否 | 應佔全形字寬 | |||
引號 | 「 | U+300C | LEFT CORNER BRACKET | 是 | 否 | 否 | 是 | 是 | 主用於繁體 | ||
」 | U+300D | RIGHT CORNER BRACKET | 是 | 是 | 是 | 否 | 否 | 主用於繁體 | |||
『 | U+300E | LEFT WHITE CORNER BRACKET | 是 | 否 | 否 | 是 | 是 | 主用於繁體 | |||
』 | U+300F | RIGHT WHITE CORNER BRACKET | 是 | 是 | 是 | 否 | 否 | 主用於繁體 | |||
“ | U+201C | LEFT DOUBLE QUOTATION MARK*4 | 是*2 | 否 | 否 | 是 | 是 | 主用於簡體 | |||
” | U+201D | RIGHT DOUBLE QUOTATION MARK*4 | 是*2 | 是 | 是 | 否 | 否 | 主用於簡體 | |||
‘ | U+2018 | LEFT SINGLE QUOTATION MARK*4 | 是*2 | 否 | 否 | 是 | 是 | 主用於簡體 | |||
’ | U+2019 | RIGHT SINGLE QUOTATION MARK*4 | 是*2 | 是 | 是 | 否 | 否 | 主用於簡體 | |||
夾注號(繁) | ( | U+FF08 | FULLWIDTH LEFT PARENTHESIS | 是 | 否 | 否 | 是 | 是 | |||
) | U+FF09 | FULLWIDTH RIGHT PARENTHESIS | 是 | 是 | 是 | 否 | 否 | ||||
破折號 | —— | U+300B | EM DASH | 是 | 否 | 否 | 否 | 否 | 是*3 | ||
書名號 | 《 | U+300B | LEFT DOUBLE ANGLE BRACKET | 是 | 否 | 否 | 是 | 是 | |||
》 | U+300B | RIGHT DOUBLE ANGLE BRACKET | 是 | 是 | 是 | 否 | 否 | ||||
〈 | U+3009 | LEFT ANGLE BRACKET | 是 | 否 | 否 | 是 | 是 | ||||
〉 | U+3009 | RIGHT ANGLE BRACKET | 是 | 是 | 是 | 否 | 否 | ||||
刪節號(繁)
省略號(簡) |
…… | U+2026 | HORIZONTAL ELLIPSIS*5 | 是 | 否 | 否 | 否 | 否 | 是*3 | ||
…… | U+22EF | MIDLINE HORIZONTAL ELLIPSIS*5 | 是 | 否 | 否 | 否 | 否 | 是*3 | |||
連結號 | ~ | U+FF5E | FULLWIDTH TILDE | 是 | 是*1 | 是 | 否 | 否 | |||
- | U+002D | HYPHEN-MINUS | 是 | 是*1 | 是 | 否 | 否 | ||||
— | U+2014 | EM DASH | 是 | 是*1 | 是 | 否 | 否 | ||||
間隔號 | · | U+00B7 | MIDDLE DOT | 否 | 是*1 | 是 | 否 | 否 | 簡體標準佔半字寬 | ||
‧ | U+2027 | HYPHENATION POINT*4 | 否 | 是*1 | 是 | 否 | 否 | ||||
分隔號 | / | U+002F | SOLIDUS | 是 | 是 | 主用於簡體 | |||||
/ | U+FF0F | FULLWIDTH SOLIDUS | 否 | 是 | 否 | 主用於繁體 | |||||
引號類 | 【 | U+3010 | LEFT BLACK LENTICULAR BRACKET | 是 | 否 | 否 | 是 | 是 | |||
】 | U+3011 | RIGHT BLACK LENTICULAR BRACKET | 是 | 是 | 是 | 否 | 否 | ||||
〖 | U+3016 | LEFT WHITE LENTICULAR BRACKET | 是 | 否 | 否 | 是 | 是 | ||||
〗 | U+3017 | RIGHT WHITE LENTICULAR BRACKET | 是 | 是 | 是 | 否 | 否 | ||||
〔 | U+3014 | LEFT TORTOISE SHELL BRACKET | 是 | 否 | 否 | 是 | 是 | ||||
〕 | U+3015 | RIGHT TORTOISE SHELL BRACKET | 是 | 是 | 是 | 否 | 否 | ||||
[ | U+FF3B | FULLWIDTH LEFT SQUARE BRACKET | 是 | 否 | 否 | 是 | 是 | ||||
] | U+FF3D | FULLWIDTH RIGHT SQUARE BRACKET | 是 | 是 | 是 | 否 | 否 | ||||
{ | U+FF5B | FULLWIDTH LEFT CURLY BRACKET | 是 | 否 | 否 | 是 | 是 | ||||
} | U+FF5D | FULLWIDTH RIGHT CURLY BRACKET | 是 | 是 | 是 | 否 | 否 |
為了使用符合語意的描述,並同時涵括中文的二大書寫方向(直、橫排),使用以下詞彙來形容漢字的四個方向,以避免歧義。
严格来说,一般认为「音节 = 声母 + 韵母 + 声调」,韵母(final)包含介音(medial)和韵(rime),而「韵 = 韵腹 + 韵尾」。「介音」又称「韵头」,即「韵母 = 韵头 + 韵腹 + 韵尾」。注音符号的情况比较含糊,注音符号体系里称作「韵母」的字符实际上应该算作「韵」,加上介音才是韵母。
或是邮件反馈可也:
askdama[AT]googlegroups.com
订阅 substack 体验古早写作:
关注公众号, 持续获得相关各种嗯哼: