バックスラッシュと円マーク

授業のC言語のプログラムで printf 関連でいくつか質問を受けることが多いのでメモ

Visual Studio では printf_s() , scanf_s() を使う

Microsoft の Visual Studio でプログラミングの勉強をする人も多いだろうが、C 言語の基本関数 printf() とか scanf() を使ったプログラムが動かないというトラブルを聞く。

C言語の scanf() がバッファオーバーフロー対策が怪しいため、Visual Studio(Microsoft) では保護対策してある scanf_s() があり、これを使えということになっている。バッファオーバーフローの危険があるのは、scanf() なんだけど、同様に printf() の代わりに、printf_s() が用意されている。

C言語標準関数	Microsoft関数	備考
scanf()	scanf_s()	汎用フォーマット入力
printf()	printf_s()	汎用フォーマット出力
strcpy()	strcpy_s()	文字列コピー同様の関数: strncpy()
strdup()	_strdup()	文字列をヒープメモリにコピー

すでに提出されているレポートを見ると、同様に strcpy() もセキュリティ対策の strcpy_s() を使っている人も多いようです。

マイクロソフト御謹製の strcpy_s() を使わなくても、C言語標準関数には strncpy() があるが、若干動きが違うみたい。

バックスラッシュ∖ と円マーク￥

元々コンピュータの 8bit で表現する基本的な英数字には、ASCII コード表が決められている。ASCII コード表の中では、0x5C には、バックスラッシュ「∖」が割り振られている。コンピュータが日本で使われるようになると、ASCII コード表に、半角カタカナを追加した JIS コード表(1バイト文字) が決められている。文字コード 0x00～0x7F までは ASCII コードと基本的に同じであるが、唯一 0x5C には、∖ の代わりに円マーク「￥」が割り振られた。

このため、C言語の改行文字を表す “∖n” は、日本のパソコンで表示すると“￥n”と表示されるし、日本語のコンピュータの教科書では、”￥n”にて記載されていることが多い。同様に、Windows のディレクトリ区切り文字は本来∖であり、ファイルパスは“C:∖Users∖foobar” のように示されるが、日本のパソコンでは、“C:￥Users￥foobar” と表示される。

プログラムのエディタでＣ言語のプログラミングをする際は、以前であれば、キーボードの￥マークをタイプすれば、￥が表示されるが、内部的には文字コード 0x5C で保存される。最近の開発環境なら、￥マークをタイプすれば、∖ が表示されるものも増えてきた。

ただ、エディタによっては、今まで内部コードでの 0x5C を、英文字フォントならバックスラッシュ ∖(Unicode 0x5C) 、日本語フォントなら円マーク￥ (Unicode 0xA5) と明確に区別している場合がある。

私の講義資料では、改行は “￥n” にて見えるはず。入力時には状態によって∖に見えたり￥に見えたりするので、Web画面で表示される時の文字フォントの影響を受けているようだ。

このため、私の講義資料をコピー＆ペーストで、∖と￥を明確に区別するエディタに張り付けると、0x5C でなく 0xA5 として扱われることがある。この内容をＣ言語でコンパイルしてprintf(“Hello World.￥n”);を実行すると、行末で改行されず「Hello World￥n」と表示されることがある。

この資料を書くにあたって、∖と￥をWordPressのエディタで入力しているが、実は∖は「差集合記号」で記載しているし、￥は「全角円マーク」で記載している。

日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

バックスラッシュと円マーク

Visual Studio では printf_s() , scanf_s() を使う

バックスラッシュ∖ と円マーク ￥

バックスラッシュ∖ と円マーク￥