Unicodeといえば...

「Unicode」のピックアップ・エントリー

Unicode w
Unicode(ユニコード)とは、コンピュータ上で多言語の文字を一つの文字コードで取り扱うために1980年代に提唱された文字コードである。ゼロックス社が提唱し、マイクロソフト、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られ、1993年に国際標準化機構 ISOでもISO/IEC 10646の一部として標準化された。世界の文字を共通の文字コードにしようということで作られ、Windows NT系 NT系のMicrosoft Windows、Mac OS X、LinuxやJava言語などで基本的な文字コードとして利用されている。他の文字コード(符号化方式)との変換の整合性などでいくつかの問題も残る。
実体参照 w
実体参照(じったいさんしょう、”Entity reference” の訳語)とは、HyperText Markup Language HTML文書などのStandard Generalized Markup Language SGML文書において、直接記述できない文字や記号(マークアップで使われる<や>など)を表記する際に用いられる方法である。SGML構成素の1つとして定義されており、文書文字集合中の文字を参照する為の手段を提供する。Extensible Markup Language XMLではHTMLでいうところの「文字実体参照」を指す言葉であり、「数値文字参照(XMLでは文字参照)」の概念は含まれない。具体的な実体参照の一覧表は、Wikipedia:特殊記号に存在する。HTMLにおける実体参照には、表記方法により数値文字参照 (”Numeric character reference”) と文字実体参照 (”Character entity reference”) の二種が存在する。XMLではそれぞれ文字参照 (”Character reference”) と実体参照 (”Entity reference”) に相当する。
UTF-16 w
『Unicode』より : Unicode(ユニコード)とは、コンピュータ上で多言語の文字を一つの文字コードで取り扱うために1980年代に提唱された文字コードである。ゼロックス社が提唱し、マイクロソフト、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られ、1993年に国際標準化機構 ISOでもISO/IEC 10646の一部として標準化された。世界の文字を共通の文字コードにしようということで作られ、Windows NT系 NT系のMicrosoft Windows、Mac OS X、LinuxやJava言語などで基本的な文字コードとして利用されている。他の文字コード(符号化方式)との変換の整合性などでいくつかの問題も残る。
UTF-8 w
UTF-8(旧UTF-2)はUCS(ISO/IEC 10646)、Unicodeで使える符号化方式。正式名称は、ISO/IEC 10646では8-bit UCS Transformation Format、UnicodeではUnicode Translation Format-8という。両者はUCS-4とUnicodeのコード重複範囲で互換性がある。2バイト目以降に”/”などのコードが現れないように工夫されていることから、UTF-FSS(File System Safe)ともいわれる。Request for Comments RFC 2279にもISO/IEC 10646と同様の仕様がある。データ交換方式、ファイル形式としては一般的にUTF-8が使われる傾向がある。Wikipediaでも全面的に採用されている。American Standard Code for Information Interchange ASCII文字と互換性を持たせるために、ASCIIと同じ部分は1バイト、その他の部分を2~6バイト(Unicodeの範囲では2~4バイト)で指定する。
文字集合 w
文字集合 (character set) とは、文字を重複なく集めたものである。文字セットという場合もある。例えば、「全てのアルファベット」(a, b, c, ..., z, A, B, C, ..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う, ..., ん)というのもまた、ひとつの文字集合である。コンピュータ上で文字を扱う場合、文字ごとに符号化表現 (ビット組合せ) を割り当てるため、どの文字を扱うかということを決めなければならない。このため文字集合の定義が必要となる。コンピュータで扱う文字集合内の各文字には符号 (ビット組合せ、または番号) が割り当てられているのが通常であり、これを符号化文字集合と言う。実際にコンピュータ上で使われている符号化文字集合には、例えばJIS X 0201 や JIS X 0208がある。
UCS w
社名 株式会社UCS 英文社名 UCS Co., Ltd. ロゴ 種類 株式会社 略称 国籍 郵便番号 492-8686 本社所在地 愛知県稲沢市天池五反田町1 電話番号 0587-30-5000 業種 7200 統一金融機関コード SWIFTコード 事業内容 総合あっせん事業など 代表者 代表取締役社長 山下正行 資本金 16億1,089万円 発行済株式総数 売上高 191億8,208万円(2009年2月期) 営業利益
CJK統合漢字 w
CJK統合漢字(シージェーケーとうごうかんじ、CJK Unified Ideographs)は、Unicodeに実装されている漢字コードのマップで、漢字をUnicodeに実装する際に、中国 (China)、日本 (Japan)、大韓民国 韓国 (Korea) で使われている漢字をひとまとめにして登録したことから各国の頭文字をとりCJK統合漢字と呼ぶ。一部にヴェトナムで使われていた漢字が入っているため、CJKVと呼ばれる事もある。もともとUnicodeは、65,536文字の中に世界中の文字を収めようという考えがあったために一番領域を消費する漢字コードを圧縮するために、中国、日本、韓国で微妙に字形が異なる漢字の違いは無視し、似た字体を統合して実装した。ただし、既存のコード体系で区別されている文字は別のコードポイントに割り当てられているほか、簡体字と繁体字など明らかに字体の異なる文字も別のコードポイントに割り当てられている。
文字符号化方式 w
『符号化方式』より : 符号化方式(ふごうかほうしき)は、デジタル処理・伝送・記録のための、情報のデジタルデータへの変換方式のことである。変換されたデータを符号と呼び、符号から元の情報へ戻すことを復号と呼ぶ。情報をデジタルデータ化すると、コンピュータ(処理)や光ケーブル(伝送)、メモリ・ディスクなどの記録媒体(蓄積)で扱いやすい。この符号化には、次の二つがある。情報源符号化(Source Coding)とは文字・画像・音声などの元情報の符号化である。符号化の対象となる情報の性質に応じた符号化方式が選択される。例えば、音響であれば人間の聴覚の特性に基づいたサンプリング周波数の選択や、心理聴覚理論に基づいた高効率符号化(高能率符号化あるいはデータ圧縮 圧縮とも)などが行われる。
JIS w
『日本工業規格』より : 日本工業規格(にほんこうぎょうきかく)は、日本国内で製造・使用されるさまざまな鉱業 鉱・工業製品などの国家規格である。英語名称が Japanese Industrial Standards(個々の規格票では複数形のsを付けない)であるため、ふつうはJIS(ジス)と略されたり、その規格をJIS規格(ジスきかく)と呼ぶことが多い。JISの規格は、経済産業省(旧・通商産業省)の日本工業標準調査会 (JISC) により審議・制定されて、経済産業省により認定され、財団法人日本規格協会 (JSA) により規格票が発行される。JISマーク表示制度にもとづいて、経済産業省によりこの規格に適合していると認定された製品には、JISマークが表示される。1949年(昭和24)制定の工業標準化法により、規格票と呼ばれる規定文書に定められた工業品の形状、品質、性能、生産方法、試験方法等について統一を図る必要のあるものの標準、すなわち規格を規定している。2006年3月末現在で9,728件が制定されている。
UTF w
『Unicode』より : Unicode(ユニコード)とは、コンピュータ上で多言語の文字を一つの文字コードで取り扱うために1980年代に提唱された文字コードである。ゼロックス社が提唱し、マイクロソフト、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られ、1993年に国際標準化機構 ISOでもISO/IEC 10646の一部として標準化された。世界の文字を共通の文字コードにしようということで作られ、Windows NT系 NT系のMicrosoft Windows、Mac OS X、LinuxやJava言語などで基本的な文字コードとして利用されている。他の文字コード(符号化方式)との変換の整合性などでいくつかの問題も残る。

[PR]エロゲーだけで満足してますか?

注目キーワード