大文字と小文字

大文字と小文字(おおもじとこもじ)は、アルファベットにおける同一字母の2つの表現形である。同じ字母の大文字小文字は同じ文字の代替表現であり、同じ名前と発音を持ち、アルファベット順に並べ替える際には同じように扱われる。多くの場合、アルファベットに属する全ての文字は大文字と小文字の2つの形を持つ。大文字と小文字の区別のことをレターケース(letter case)という。

小文字の"a"と大文字の"A"

一般的には大文字と小文字は混在させて使用され、読みやすさを考慮して大文字と小文字の両方を使用する。大文字と小文字の選択は、言語の文法や特定の分野の慣習によって規定されることが多い。正書法では、大文字は主にの最初の文字や固有名詞の語頭のような特別な目的のために使用され、それ以外については小文字を使用するのが一般的である。

いくつかの分野では、大文字か小文字のどちらかのみを使用することが慣例となっている。例えば、工学分野の設計図は、一般的に全て大文字でラベル付けされている。一方、数学では、大文字はオブジェクト間の関係を示すことがあり、しばしば上位のオブジェクトを表すのに使用される(例えば、Xは要素xを含む集合を表すなど)。

用語

大文字用のケースと小文字用のケース
活字ケースの配置

英語においては、大文字をupper case(アッパーケース)、小文字をlower case(ローワーケース)という。これらの用語は、「活字ケース」と呼ばれる、活版印刷用の活字を収納するための引き出しの一般的なレイアウトに由来している。伝統的に、大文字の活字を入れたケースは、小文字のケースの上に配置していた[1][2]

古書体学において、アセンダーやディセンダーがほとんどない、もしくは全くないもの(バチカン写本ケルズの書など)をマジャスキュール(majuscule ([məˈʌskjuːl], [ˈmæəskjuːl]))という。その視覚的なインパクトのため、マジャスキュールという用語は、後に一般的に「大文字」と呼ばれるようになったもののことも指すようになった。

それに対して、ミニュスキュール(minuscule)は小文字のことを指す。この単語は、ミニチュア(miniature)や接頭辞mini-との混同から、miniscule(ミニスキュール)と綴られることが多い。これは伝統的にスペルミスとみなされてきたが(minusculeの語源はminusであるため[3])、現在では非常に一般的であり、一部の辞書では非標準または変形スペルとして受け入れられている[4]

タイポグラフィにおける考慮

小文字のグリフは、大文字のグリフを単に小さくしただけの場合(“C”と“c”、“S”と“s”など)もあれば、一見ほとんど関係ないように見える場合(“D”と“d”、“G”と“g”など)もある。以下に英語アルファベットの大文字と小文字を上下に並べたものを挙げる(正確な表現は、使用する書体フォントによって異なる)。

大文字 ABCDEFGHIJKLMNOPQRSTUVWXYZ
小文字 abcdefghijklmnopqrstuvwxyz
アセンダー(この例では“h”)やディセンダー(この例では“p”)があるため、小文字の高さは様々である。

タイポグラフィ的には、大文字と小文字の基本的な違いは、大文字が大きくて小文字が小さいということではなく、一般的に大文字は高さが全て同じであるということである。ただし、書体によっては例外もあり、特に“Q”や“J”はベースラインよりも下にはみ出る場合もある。また、様々なダイアクリティカルマークは文字の通常の高さに追加することができる。

小文字の高さには、一般的な小文字の高さよりも上にはみ出るもの(アセンダー)や下にはみ出るもの(ディセンダー)があるため、バリエーションが多い。通常、b,d,f,h,k,l,t[注釈 1]はアセンダーを持つ文字で、g,j,p,q,yはデセンダーを持つ文字である。また、一部の伝統的なフォントや古典的なフォントで使われている旧式の数字では、6と8がアセンダーを持ち、3、4、5、7、9がディセンダーを持つ。

大文字と小文字の使い分け

筆記体のキリル文字
1927年から1938年まで使用されていた、ラテン文字を元にしたアディゲ語のラテンアルファベット。ラテン文字の大文字に似た文字もあるが、全て小文字である。

ラテン文字ギリシア文字キリル文字コプト文字アルメニア文字アドラム文字ワラング・クシティ文字チェロキー文字オサジ文字を使用している言語では、文字の明瞭性と読みやすさを高めるために、大文字・小文字の区別をしている(bicameral scripts)。また、かつて使われていたデザレット文字にも大文字・小文字の区別があった。グルジア文字にはいくつかのバリエーションがあり、それらを別の大文字とする試みもあったが、現代のグルジア語の書き言葉では大文字と小文字を区別していない[6]

他の多くの言語では、大文字と小文字の区別がない(ユニケース)。これには、ほとんどの音節文字やその他の非アルファベット文字が含まれる[注釈 2]

大文字と小文字の区別がある文字では、一般的にテキストの大部分には小文字が使用され、大文字は文頭や固有名詞の語頭など、限られた場所でのみ使用される。また、強調表現で大文字が使用されることもある。頭字語は全て大文字(オールキャップス)で書かれることが多い。

キャピタライゼーション

キャピタライゼーション(Capitalisation、大文字化)とは、単語の最初の文字を大文字にして、残りの文字を小文字にして書くことである。大文字表記のルールは言語によって異なり、非常に複雑であるが、大文字表記を採用している現代のほとんどの言語では、全ての固有名詞および全てのの最初の単語の1文字目を大文字で表記する。

英語の大文字表記は、文脈に関係なく一般的な正書法のルール(例:タイトルと見出しと本文)に基づいて、形式的な文章では普遍的に標準化されている。文の頭文字、固有名詞、固有形容詞の頭文字を大文字にする。曜日や月の名前の頭文字や、一人称代名詞の"I"[7]感動詞の"O"も大文字で表記される(後者は現代ではあまり使用されず、"oh"と表記されることが多い)。1文字目の大文字と小文字の区別だけで意味が変わる単語の組がいくつかあり、これをキャピトニムという。敬称や地位や威信を示す個人の肩書きは、人名と一緒に使用する場合や直接の挨拶として使用する場合には大文字になる(例えば、"Mr. Smith"、"Bishop O'Brien"、"Professor Moore"など)が、単独で使用する場合やより一般的な意味で使用する場合には通常は大文字にはならない[8][9]。また、一神教を指す単語(文脈によってはそれを指す代名詞でさえも[10])は、頭文字を大文字にする(例:“God”)のが慣例となっている。

その他の単語は通常、小文字で始まる。しかし、見出しや出版物のタイトルなど、強調するために大文字を使用する場合もある(下記参照)。いくつかの伝統的な詩の形式では、文法的な特徴とは無関係に、詩の行の始まりを示す目印として大文字が使われてきた。

ドイツ語では、固有名詞以外を含めて全ての名詞が大文字で始まる(これは英語でも、主に17~18世紀には一般的であった)。ロマンス語や他のほとんどのヨーロッパ言語では、曜日の名前、月の名前、および国籍や宗教などの形容詞は、通常、小文字で始まる[11]。いくつかの言語では、DeDem(デンマーク語)、SieIhnen(ドイツ語)、VdUd(スペイン語におけるustedの略)などのように、フォーマルな敬語代名詞の頭文字を大文字にする習慣がある。

特別な文字と二重音字

  • ドイツ語の文字"ß"(エスツェット)は、通常語頭には現れない文字であることから、小文字しかなかった。オールキャップスの場合は伝統的に二重音字"SS"に置き換えることになっていた。2017年6月に大文字のエスツェット(ẞ)が正式に認められた[12]
  • いくつかの言語では、特定の二重音字は1文字とみなされることがある。オランダ語では、語頭の二重音字“ij”を大文字にする場合は、2文字とも大文字で書く(例えば、“Ijsland”ではなく“IJsland”)[13]。他の言語、例えばウェールズ語ハンガリー語では、二重音字は1文字とみなされるが、オランダ語とは異なり、構成要素の1番目が大文字になっていても2番目は小文字で書かれる。南スラブ言語のラテン文字表記にも同様の二重音字lj、nj、džが存在するが、これらの二重音字の大文字小文字に関しUnicodeでは、3種の表記(全て大文字、全て小文字、1文字目だけ大文字)のすべてに対し1つずつ区画を割り当てている[14]
  • ハワイ語の正書法では、シングルクォーテーションアポストロフィに似た「ʻ」(オキナ)は声門閉鎖音を表し、文字としても[15]ダイアクリティカルマークとしても位置づけられる[16]。オキナには大文字・小文字の区別はなく、文頭・語頭など通常大文字で書かれる場所にオキナが現れる場合は、その次の文字を大文字で表記する。Unicode標準では、オキナはU+02BB ʻ modifier letter turned commaとして符号化されている[17]が、シングルクォーテーションやアポストロフィで代用することも珍しくない[18]

使用法

ケーススタイル

1919年11月に発行された『ニューヨーク・タイムズ』の記事の冒頭で、オールキャプスとタイトルケースを交互に使用している例。

英語では、様々な場面で様々なケーススタイルが使われている。

センテンスケース(sentence case)
"The quick brown fox jumps over the lazy dog"
文章の最初の単語をキャピタライゼーションし、固有名詞やその他の単語も特定の規則で必要とされる場合にキャピタライゼーションする、大文字と小文字の混在したスタイル。
プログラミングでは、センテンスケースは他の規則よりも自動化が容易である。例えば、英語版ウィキペディアでは、ページタイトルの最初の文字はデフォルトで大文字になっている。
タイトルケース(title case)
"The Quick Brown Fox Jumps over the Lazy Dog"
特定の部分集合(特に冠詞、短い前置詞や接続詞)以外の全ての単語をキャピタライゼーションしたスタイル。キャピタルケース(capital case)、ヘディングスタイル(headline style)ともいう。テキスト処理では、品詞に関係なく全ての単語をキャピタライゼーションする場合もあり、これをスタートケース(start case)またはイニシャルキャップ(initial caps)という。
オールキャプス(all caps)
"THE QUICK BROWN FOX JUMPS OVER THE LAZY DOG"
全ての文字を大文字で書くスタイル。これは、見出しに使用したり、タイプライターなど太字が使用できない場合の強調表現など、特殊な状況で使用される。インターネットの出現に伴い、強調のためにオールキャプスがよく使われるようになったが、オールキャプスで入力することは、一部の人たちの間でネチケットに反するとみなされており、それは人前で叫ぶことに等しいと言われている[19]。特にパスポートなどの身分証明書では、姓と名を区別するために、姓をオールキャプスで書くのが一般的である。オールキャプスによる長い文章は読みにくくなる。これは、小文字におけるアセンダーやディセンダーが認識と可読性の向上に寄与しているためである。
スモールキャプス(small caps)
"The quick brown fox jumps over the lazy dog"
オールキャプスに似ているが、センテンスケースで小文字で書く部分を、小文字の"x"と同じ高さの大文字で表記するスタイル。これは、Copperplate Gothicなどの特定のフォントの特徴である。組版の伝統では、スモールキャプスの高さは書体のx-heightと同じか、それより少し大きくすることができる[20]。スモールキャプスは、頭字語、名前、数学的実体、印刷されたテキスト内のコンピュータコマンド、ビジネスや個人用の便箋など、あるフレーズを本文と区別する必要がある状況で使用することができる。
オールローワーケース(all lowercase)
"the quick brown fox jumps over the lazy dog"
全ての文字を小文字で書くスタイル。詩などの芸術的効果のために使用されることがある。また、コンピュータ言語や、SMSやインスタントメッセージングなどの非公式な電子通信でもよく見られる(シフトキーを避けて、より速くタイプするため)。アップルの共同創業者であるスティーブ・ジョブズは、署名に全て小文字を使用している[21]

特別なケーススタイル

コンピュータプログラミングや製品ブランディング、その他の専門分野では、標準的な文章では使用されない特殊なケーススタイルが使用されることがある。

キャメルケース(camel case)
"theQuickBrownFoxJumpsOverTheLazyDog" または "TheQuickBrownFoxJumpsOverTheLazyDog"
スペースや句読点を削除し、各単語をキャピタライゼーションする。1つ目の単語からキャピタライゼーションする場合("CamelCase"、"PowerPoint"、"TheQuick..."など)を、アッパーキャメルケース(upper camel case)またはパスカルケース(Pascal case)という。最初の単語のみキャピタライゼーションしない場合("iPod"、"eBay"、"theQuickBrownFox..."など)を、ローワーキャメルケース(lower camel case)やドロメダリーケース(dromedary case)[注釈 3]という。ローワーキャメルケースは、情報技術製品やサービスのブランディングでよく使われる。
スネークケース(snake case)
"the_quick_brown_fox_jumps_over_the_lazy_dog"
句読点を除去し、スペースをアンダーバーに置き換える。通常は、大文字・小文字のどちらかのみを使用する(例:"UPPER_CASE_EMBEDDEDDED_UNDERSCORE"、"lower_case_embedded_underscore")が、OCamlでは大文字と小文字を混在させることもできる[22]。このスタイルはpothole caseと呼ばれることもあり、特にPythonでは変数の命名にこの慣習がよく使われている。
ケバブケース(kebab case)[23]
"the-quick-brown-fox-jumps-over-the-lazy-dog"
スネークケースに似ているが、アンダーバーの代わりにハイフンを使用する。スピナルケース(spinal case)、パラムケース(param case)、Lispケースなどともいう。
スタッドリーキャプス(studly caps)
"tHeqUicKBrOWnFoXJUmpsoVeRThElAzydOG"
オルタネーティングキャプス(alternating caps)ともいう。大文字の使用に意味的または構文的な意味を持たないもの。母音だけが大文字になることもあれば、大文字と小文字が交互になることもあるが、単にランダムであることが多い。studlyとは「男らしい」「性的魅力がある」といった意味で、この書き方をしようとする書き手が格好つけようとしていると皮肉る意味合いによる命名である。

メートル法における単位記号

7つのSI基本単位。この内、"A"(アンペア)と"K"(ケルビン)のみ人名に由来するためキャピタライゼーションされている。

国際単位系(SI)における単位記号では、大文字と小文字で異なる意味を持つ。通常は単位記号は小文字で表記されるが、単位の名称が固有名詞に由来する場合は、記号の最初の文字が大文字で表記される。これは単位「記号」の場合の規則であり、単位の「名称」を綴る場合は普通名詞の扱いとなり、文中の場合は固有名詞由来であっても全て小文字で綴られる[24]

ただし、リットルは、固有名詞由来ではないため、本来は単位記号は小文字で"l"とするべきであるが、数字の"1"と紛らわしいため、特別に大文字で"L"と書いて良いこととされている[24]

接頭辞記号の大文字・小文字は、それが付けられている単位記号とは無関係に決定される。比較的新しく制定された接頭辞については、分量単位用は小文字、倍量単位用は大文字と分かれているが、古くから使用されている倍量単位用接頭辞(103キロ(k)以下)については小文字が使われている[24]

フォールドケースと大文字小文字変換

コンピュータ用に開発された文字セットでは、大文字と小文字の各文字は別々の文字としてエンコードされている。大文字・小文字を変換するためには、同じ文字の大文字・小文字を表す2つの文字コードを紐付ける必要がある。

大文字・小文字を区別しない操作(ケース・インセンシティブ)は、大文字と小文字が一致するように文字コード表を折りたたむ(fold)という考えから、フォールドケース(fold case)ともいう。文字列の大文字・小文字の変換は、例えば大文字・小文字を同一視した比較を行うなど、コンピュータアプリケーションでは一般的に行われている。多くの高水準プログラミング言語は、少なくともASCII文字セットについては、大文字小文字変換のための簡単なメソッドを提供している。

大文字と小文字を等価として扱うかどうかは、コンピュータシステムや場合によって異なる。例えば、ユーザのパスワードは、より多様性を持たせ、破られにくくするために、一般的には大文字と小文字が区別される。一方、キーワード検索を行う際に大文字と小文字を区別すると、検索結果が絞り込まれすぎてしまう可能性があるため、一般には同一視される。

Unicodeにおけるフォールドケースと文字の識別

Unicodeでは、各キャラクタに大文字・小文字の区別に関して、大文字(upper case)、小文字(lower case)、タイトルケース(title case)の3種類の属性が定義されている。ここで「タイトルケース」とは、合字二重音字の2文字目で、1文字目の大小に連動して変化するもののことを指す[25]。これらのプロパティは、大文字小文字が異なる用字内の全ての文字を、大小の異なる別の文字に関連付ける。

Unicodeテクニカルノート#26で簡単に議論されているように、実装上の問題として、ラテン文字、ギリシャ文字、キリル文字の統一を試みると、大混乱を引き起こし、事実上、全ての大文字小文字操作をケース・センシティブなものにしてしまう[26]。言い換えれば、A, B, E, H, K, M, O, P, T, X, Yなどの文字の形は、ラテン文字、ギリシャ文字、キリル文字の間で共有されている(ホモグリフ)。ここで、同じ字形のBに対して単一の文字コードを与えたとき、それに対応する小文字が、ラテン文字ではb(U+0062)、ギリシャ文字ではβ (U+03B2)、キリル文字ではв (U+0432)と異なっており、プログラムで大文字を小文字に変換する際に、どの文字に変換すればよいかの識別が困難になる。そのため、対応するラテン文字、ギリシャ文字、キリル文字の大文字(それぞれU+0042、U+0392、U+0412)も、外観は基本的に同じであるにもかかわらず、別々の文字としてエンコードされている。

脚注

注釈

  1. アンティクアやその他の正体フォントでは、廃止された長いs(ſ)はアセンダーを有したが、斜体では、英語アルファベットや拡張ラテンアルファベットでアセンダーとディセンダーの両方を持つ2つの文字のうちの1つだった。もう1つは"f"である[5]
  2. なお、日本語において拗音促音の表記に用いられる捨て仮名のことを「小文字」と表現することもあるが、これは本項目で説明する「小文字」とは性質が異なるものである。
  3. dromedaryはヒトコブラクダのこと。

出典

  1. Hansard, Thomas Curson (1825). Typographia, an Historical Sketch of the Origin and Progress of the Art of Printing. pp. 408, 4806. https://archive.org/details/typographiaanhi01hansgoog 2015年8月12日閲覧。
  2. Marc Drogin (1980). Medieval Calligraphy: Its History and Technique. Courier Corporation. p. 37. https://books.google.com/books?id=oHNtDQAAQBAJ&pg=PA37
  3. Charlton T. Lewis (1890). “Minusculus”. An Elementary Latin Dictionary. New York, Cincinnati, and Chicago: American Book Company. http://www.perseus.tufts.edu/cgi-bin/ptext?doc=Perseus%3Atext%3A1999.04.0060%3Aentry%3D%239936
  4. The American Heritage Dictionary of the English Language (4th ed.). Boston and New York: Houghton Mifflin. (2000). ISBN 978-0-395-82517-4
  5. Nesbitt, Alexander (1957). The History and Technique of Lettering (1st ed.). New York City: Dover Publications. ISBN 0-486-20427-8
  6. Březina, David (2012). Challenges in multilingual type design. pp. 14.
  7. Dennis Oliver. Using Capital Letters (#1)”. Dave's ESL Cafe. 2017年2月19日閲覧。
  8. Nancy Edmonds Hanson (2008年8月25日). AP Style: Courtesy and Professional Titles”. Minnesota State University. 2017年2月19日閲覧。
  9. Capitalizing Titles of People”. English Plus (1997–2006). 2017年2月19日閲覧。
  10. Capitalization”. The Chicago Manual of Style Online. 2017年2月19日閲覧。
  11. Citing Sources: Capitalization and Personal Names in Foreign Languages”. Waidner-Spahr Library. Dickinson. 2017年3月30日閲覧。
  12. Cf. Güthert, Kerstin (2017), PRESSEMITTEILUNG 29.6.2017 Amtliches Regelwerk der deutschen Rechtschreibung aktualisiert, Council for German Orthography, p. 1, http://www.rechtschreibrat.com/DOX/rfdr_PM_2017-06-29_Aktualisierung_Regelwerk.pdf 2017年6月29日閲覧。.
  13. Ijsland / IJsland”. Taalunie. 2014年3月9日閲覧。
  14. Latin Extended-B (PDF)”. Unicode. 2017年2月5日閲覧。
  15. Why I Spell it Hawai‘i and not Hawaii, and Why You Should, Too”. Blond Voyage. 2017年8月6日閲覧。
  16. Hawaiian Language Online”. The University of Hawai‘i. 2017年8月6日閲覧。
  17. Spacing Modifier Letters (PDF)”. Unicode. 2017年8月6日閲覧。
  18. ‘Ōlelo Hawai‘i on the WWW: A.K.A., How To Give Good ‘Okina”. KeolaDonaghy.com. 2017年8月6日閲覧。
  19. RFC 1855 "Netiquette Guidelines"
  20. Registered features – definitions and implementations”. OpenType Layout tag registry. Microsoft. 2017年3月24日閲覧。
  21. Robin. lower case typography and steve jobs (オランダ語). 2019年11月14日閲覧。
  22. Caml programming guidelines (英語). caml.inria.fr. 2017年3月31日閲覧。
  23. jQuery 3.0 and jQuery Compat 3.0 Alpha Versions Released”. 2020年7月9日閲覧。
  24. Bureau International des Poids et Mesures (2006年). The International System of Units (PDF)”. Organisation Intergouvernementale de la Convention du Mètre. pp. 121, 130–131. 2014年1月12日閲覧。
  25. Character Properties, Case Mappings & Names FAQ”. Unicode. 2017年2月19日閲覧。
  26. Unicode Technical Note #26: On the Encoding of Latin, Greek, Cyrillic, and Han”. 2007年4月23日閲覧。

関連項目

外部リンク

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.