SQLServerにおけるデータの「？」文字化けとカラムの型について

2025年4月28日

システム運用において、データベースの文字化けは思いがけない混乱の一つです。

特にSQL Serverを利用する際、慣れていないとデータの先頭にNを付けても「データが？に文字化けする」現象に直面することがあります。

SQL Serverに日本語のデータを入れるには、本来NVARCHARかNCHAR型を使う必要があり、この2つの型ではないカラムに日本語のデータを入れようとしていることが理由です。

文字型データとエンコーディング

データベースは、文字情報を保存するためにさまざまなデータ型が用意されています。

SQL Serverにおいて、標準的な文字列型にはCHAR型、VARCHAR型、そしてNCHAR型、NVARCHAR型があります。

CHAR型、VARCHAR型は、非Unicode文字列を扱います。
NCHAR型、NVARCHAR型は、Unicode文字列を扱います。

重要なのが、Unicodeは世界中の文字を統一して表現できる文字コード体系であり、日本語、中国語、ハングルなどの多言語を正確に扱うためには不可欠な仕組みです。

なぜ「？」に文字化けするのか

CHAR型やVARCHAR型を使用している場合、SQL Serverはデフォルトのコードページ（例えば、英語圏ならLatin1）に基づいて文字を保存します。

これらの型は、多バイト文字（日本語など）に対応していないため、登録できない文字があると、それを代替として「？」に置き換える仕様になっています。

これは、そもそも格納できない文字を無理に保存しようとする際の、システム側の仕様です。

一方、NCHAR型やNVARCHAR型は、Unicodeをベースにしているため、日本語をはじめとする幅広い文字体系を正確に保存することができます。

つまり、多言語対応が必要な場面では、常にNCHARまたはNVARCHARを使用することが推奨されます。

実例｜違いの確認

たとえば、次のような例を考えてみましょう。

-- VARCHARに日本語を格納しようとする
CREATE TABLE [TestTable] (
[TextValue] VARCHAR(100)
);

INSERT INTO [TestTable] ([TextValue]) VALUES ('こんにちは');
SELECT * FROM [TestTable];

この場合、結果セットには「？？？？？」と表示されるか、「？」だけが見えるかもしれません。一方、以下のようにNVARCHARを使用すると、

-- NVARCHARに日本語を格納する
CREATE TABLE [TestTable] (
[TextValue] NVARCHAR(100)
);

INSERT INTO [TestTable] ([TextValue]) VALUES (N'こんにちは');
SELECT * FROM [TestTable];

正しく「こんにちは」と表示されます。

ここでのポイントは、文字列リテラルの前に「N」を付与することも忘れてはいけない点です。

これにより、SQL Serverに「これはUnicode文字列ですよ」と明示的に伝えることができます。

非Unicodeカラムに日本語を入れる

望ましくはありませんが、誤った設計で本番運用が開始された場合、非Unicodeカラムにデータを入れる必要が出てくるかも知れません。

この場合、カラムの照合順序を「Japanese_XJIS_140_CS_AS_KS（Shift-JISで表現可能な文字）」に変更します。

-- カラム単位で照合順序を見る
SELECT COLUMN_NAME, COLLATION_NAME
FROM INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_NAME = 'TestTable';

-- またはDB全体のデフォルト照合順序
SELECT DATABASEPROPERTYEX(DB_NAME(), 'Collation') AS Collation;

-- 対象カラムの照合順序の変更を行う
ALTER TABLE [TestTable] ALTER COLUMN [TextValue] VARCHAR(100) COLLATE Japanese_XJIS_140_CS_AS_KS;

上記の例だとvarcharに日本語を入れても表在されますが、Shift-JIS範囲内のみなので最終的にはnvarcharに変更した方がいいです。

まとめ

SQL Serverにおいてデータが「？」に文字化けしてしまう最大の原因は、文字列型がNVARCHARやNCHARではないことにあります。

非Unicode型では表現できない文字を保存しようとすると、仕様上自動的に「？」に置き換わります。

日本語を含むマルチバイト文字を正しく取り扱うためには、データ型の選択が極めて重要です。

設計段階から意識的にNCHARやNVARCHARを採用することが、トラブル防止の第一歩といえるでしょう。

今日の一杯

今日の一杯赤ワイン

2025/7/7

フェウド・アランチョネロ・ダーヴォラレビュー｜今日の一杯赤ワイン

「フェウド・アランチョネロ・ダーヴォラ」は、味わい深く、コスパの良い、安定した品質の一本です。トマト系の煮込み料理や、チーズをたっぷりのせたラザニアとも合い、もちろん、静かな夜にひとりでグラスを傾ける時間にもぴったり。海外の専門家たちからも高評価を得ており、日常使いからしっかりした食事まで汎用的に活躍します。味と風味口に含むと、熟したダークベリーやラズベリーの果実味が広がりながら、後半にかけてほんのりドライハーブのような余韻が続きます。酸味は控えめで、タンニンはしっかりしています。飲みごたえ ...

エナジードリンク今日の一杯

2025/6/30

ZONe ENERGY ABSOLUTE VICTORY 勝レビュー｜今日の一杯エナジードリンク

ZONe ABSOLUTE VICTORYは2025年1月に発売されたエナジードリンクです。受験勉強をイメージしたデザインの商品で、学問の神様として知られる菅原道真公を祀る太宰府天満宮に「HYPER ZONe 」を奉納し、受験生の合格を祈願しているそうです。寒い冬に体を温めるように、成分にジンジャーシロップが配合されており、堅調に生姜の味がします。カナダドライのジンジャーエールとはまた違う、比較的マイルドな飲みやすい生姜ジュースといった印象です。 ZONeの1本あたりのカフェイン量は75mgとコーヒ ...

朝倉卍丸

シングルモルトスコッチなどのお土産を持ってきた人を助けるのが好きです。サービスの分割が重要ですが、まあ昔ながらの方法でやりたいこともありますよね。

よく読まれている記事

1: 条件の0=0は全てが正であるを意味する [SQL]

SQLの条件に0=0のような記述を見かけます。変わった書き方の条件ですが、これは「全てが正である」事を意味しており、結合条件の場合はCROSS JOINと同じです。下記の例で言えば、結合するsub ...

2: DISTINCTを使わないで重複排除を考える [SQL]

SQLのDISTINCTはEXISTSとかGROUP BYでなんとかする事もできます。 DISTINCTは暗黙的なソートがされますが、何のDBを使うにせよ過去のバージョンならともかく、最近のバージョン ...

3: RFC 5322に準拠させた正規表現言語別

RFC5322で定義されている正規表現を、各言語の正規表現に変化させた形になります。完全な電子メール正規表現は存在しないので、結局のところ何かの公式基準に従っていたとしても、自分が携わるサービスのル ...

-DB, SQLServer

DB SQL コラム命名規約

2023/8/30

DB column names should use verbs as little as possible

DB column names are generally named in such a way that it is easy to visualize what kind of data is contained in them. Because DB objects have many patterns in column names, naming conventions are often not defined down to words, which can easily induce b ...

Docker SQLServer

2023/6/12

M1 MacBookでSQL Server(docker)を動作させるのは相性が良くない

後述：OSのバージョンがventuraになった事と、Docker Desktopのバージョンがv4.16以降で動作に仮対応した様です。 Rosetta 2をダウンロードし、Docker Dashboardから「Use Rosetta for x86/amd64 emulation on Apple Silicon」のチェックをオンに変更すれば動作自体は可能です。参考：Microsoft Developer Blogs ひょんなことからSQL Serverの検証をしなければいけなくなり、dockerで動くか ...

DB SQL SQLServer

2024/3/6

[SQL Server]テーブルを丸ごとコピーするSQL

SQL Serverでは、SELECT * INTOステートメントを使用することで、既存のテーブルから新しいテーブルを作成し、そのデータをコピーすることができます。データのバックアップなど、既存のテーブルと同じテーブル構成ででたを保持しておきたい時用のSQLです。 ## origin_tableにコピー元となるテーブルをしてする ## new_tableに新しいテーブル名を記述する SELECT * INTO new_table FROM origin_table; 基本的にはSELECT ...

DB SQL SQLServer

2023/6/15

SQLServerで実行計画を表示するSQL

SQLServer 実行計画を表示するsql。 SET STATISTICS PROFILE ON 一度ONにするとずっと実行計画が表示され続けるので、確認後OFFにする。 SET STATISTICS PROFILE OFF

DB 命名規約設計

2023/9/5

カラム名とフィールド名の違い

データベースのカラムとエンティティのフィールド名は、データを格納および操作する際に使用される用語です。データベースとプログラムのデータを双方向で繋ぐ部分なので、名前はほぼ同じようになり、表形式のデータにおいてはカラム名≒フィールド名です。それでも異なるものなので、異なる文脈で使用されます。以下に、それぞれの概念と違いを説明します。データベースのカラム（列）データベース内のテーブルに格納される情報を整理するために使用されます。カラムはテーブル内の垂直方向のセルで、特定のデータ型（整数、文字列、日 ...

Google Geminiはライティングとコーディングの大幅なアップグレードを実施

XServerのWordPressにおける_wtテーブルの存在