2016年7月31日(第486回)
学生さんがテスト期間中につき、教員による収録でお送りしました。
- 新任教員紹介 電気電子工学科 松浦先生
- ジャズバー歴史 48杯目 「日本人の名前」
- 地区大会の結果について
ゲスト:電気電子工学科 松浦先生
担当:佐々(物質工学科)、堀川(電気電子工学科教員)、中村(国語科教員、MC)、西(電子情報工学科教員、MIX)
2016年7月24日(第485回)
学生さんがテスト期間中につき、教員による収録でお送りしました。
- 新任教員紹介 環境都市工学科 野々村先生
- ジャズバー歴史 47杯目 「身分的周縁論」
- 寮生活について
- 地区大会の結果について
ゲスト:環境都市工学科 野々村先生
担当:村田(電子情報工学科教員)、中村(国語科教員、MC)、西(電子情報工学科教員、MIX)
安全な入力とdefineマクロ
ファイル処理の最後の説明で、バッファ・オーバーフローと、安全な入力について説明。
安全な入力
一般的なC言語での文字列入力のプログラムは、以下の様なものがテキストにも書かれている。
// memory // [局所変数str][戻り番地][..........] void foo() { char str[ 10 ] ; scanf( "%s" , str ) ; }
バッファオーバーフロー
しかし、こういった処理は極めて危険である。 入力の際に、10文字以上のデータが入力された場合、 一般的な処理系では、str[] の配列の近辺に 「関数foo()の実行後に戻る処理の番地」が格納されている場合が多く、 文字列をはみ出るような入力があった場合、処理番地を書き換えられる可能性がある。 悪意のあるプログラマーは、はみ出す領域に、戻り番地を書き換えるデータと、悪意のある処理を 書くことで、想定外の処理を動かすかもしれない。 このテクニックをバッファオーバーフローと呼ぶ。
このため、最大文字制限の機能を使い、以下のように記述すべきである。
char str[ 10 ] ; scanf( "%9s" , str ) ;
しかし、scanf() には、空白を読み飛ばす機能により「入力が無い場合…」といった 処理が書きにくい、%d入力で実数の"."や文字列を間違って入力したときの処理などの 問題があって、scanf() 単体で複雑な入力に対応することは極めて難しい。
fgets() + sscanf()
このような場合によく使われるのが、fgets()とsscanf()である。
fgets() は、文字配列に1行分のデータ(行末文字"¥n"まで)を、文字配列に読み込む関数である。 また、sscanf() は、文字配列のデータから、scanf() と同じようにデータを読み込む。
FILE* fp ; if ( (fp = fopen( "data.txt" , "rt" )) != NULL ) { char buff[ 100 ] ; while( fgets( buff , sizeof( buff ) , fp ) != NULL ) { int x ; double y ; char z[100] ; if ( sscanf( buff , "%d%lf%s" , &x , &y , z ) != 3 ) break ; // x , y , z を使った処理 } fclose( fp ) ; }
fgets() は、第一引数に、読み込み先の配列アドレス、第2引数に最大読み込みバイト数、第3引数に 読み元のファイルを指定する。文字配列への読み込み時には、第2引数のサイズを超えて 読み込むことはしないので、バッファオーバフローの心配はない。 また、入力データが無い場合には、NULL を返す。
sizeof()は、引数部分の変数のバイト数を返す演算子。
sscanf() は、データの入力が、第一引数の文字列から読み込む以外は、 scanf(),fscanf() と同じ使い方。
注意:fgets では、入力が最大バイト数以下の場合、行末文字まで読み込む。
Tips: 入力が無かったら(空行なら)、標準入力(通常キーボード入力)なら
char buff[ 1024 ] ; while( fgets( buff , sizeof( buff ) , stdin ) != NULL ) ) { // stdin は、標準入力(通常キーボード) if ( buff[ 0 ] == '¥n' ) { // 入力が空行だった場合 } }
fscanf()にfprintfがあるように、sscanfに対してsprintfもある。
char buff[ 1024 ] ; sprintf( buff , "%d %5.1lf %s" , 12 , 34.5 , "abc" ) ; // buff = "12 34.5 abc"となる。
#defineマクロ
scanfで"%d"で数字を入力する際に、文字を入力されると、あとの処理が書きにくい場合が多い。 この場合、fgetsで入力し入力データが正しい文字を使っているかチェックしてから、 sscanf()を使うなどの対処をとることが多い。 ここで、#define マクロを使ってみる
#include <stdio.h> #define isdigit(C) ((C)>='0' && (C)<='9') void main() { char buff[ 1024 ] ; while( fgets( buff , sizeof( buff ) , stdin ) != NULL ) { char* pc ; for( pc = buff ; *pc != '¥0' && isdigit( *pc ) ; pc++ ) /*nothing*/ ; if ( *pc == '¥n' || *pc == '¥0' ) { int x ; sscanf( buff , "%d" , &x ) ; } } }
#define は、通常プログラム中の定数を分かりやすく使う場合に、使われる。
#define PI 3.14159265
ただし、#で始まる行は、C言語によって特殊で、C言語の解析の前に「プリプロセッサ」 でプログラムの内容を書き換える機能。
C言語のプログラムが機械語になるまで:
C言語(#行を含む) ↓ プリプロセッサ C言語(#行なし) ↓コンパイル 中間コード(printfなどの標準関数などが未解決) ↓ リンク処理 ← ライブラリ(標準関数などの中間コードをまとめたもの) ↓ 機械語
#define マクロでは、isdigit() の引数? C が、呼び出し部の *pc となり、 isdigit( *pc ) の部分は、以下のように書き換えられる。
((defineマクロ宣言)) #define isdigit(C) ((C)>='0' && (C)<='9') ((デファインマクロを使ったら)) isdigit(*pc) ↓ C ← *pc ((*pc)>='0' && (*pc)<='9')
ただし、#defineマクロは、プログラムのコンパイル前に、文字列として書き換えを行う。
// 例1 #define begin { #define end } void main() // まるでPASCALのような記述(^_^; begin printf( "Hello¥n" ) ; end // 正しく動くよ // 例2 #define ADD(X,Y) X + Y #define MUL(X,Y) X * Y void main() { printf( "%d" , MUL( 3 , ADD( 4 , 5 ) ) ) ; } // 3 * 4 + 5 に書き換えられるので、17になる。 // 3 * (4+5) の27にはならない。 // 普通の関数のように27の結果が欲しいなら、 // #define ADD(X,Y) ((X)+(Y)) // #define MUL(X,Y) ((X)*(Y)) // と書くべき。
開いた関数と閉じた関数
#defineマクロは、定義しておいた命令への書き換えなので、関数と同じように思うかもしれない。 ただし、機械語を生成する処理の前に書き換えるので、#define マクロで書き換えられる処理が 長い場合は、生成される機械語が大きくなる場合がある。 一方で、#defineマクロを使うと引数の受け渡しが無いので、 isdigit()のような簡単な処理の場合、 生成される機械語の処理が少し速い。
// 開いた関数FOO #define FOO(X) Xを使った処理 void main() { int x ; FOO(x) ; // xを使った処理 FOO(x) ; // xを使った処理 // FOOの中身が長い場合、FOOの機械語が2個作られる。 } // 閉じた関数foo int foo(int z) { zを使った処理 : : } void main() { int x ; foo(x) ; // z←x,fooを呼び出し foo(x) ; // z←x,fooを呼び出し // fooの機械語は1個だけ,引数の受け渡し処理が2個 }
#defineマクロのADD,MULの優先順位の問題が、"醜い"と思う人は、 C++で新しく導入された、"inline"関数を勉強すること。 #defineマクロを使わずに、開いた関数を簡単に記述できる。
2016年7月17日(第484回)
- 高専地区体育大会について
- 期末試験について
- ジャズバー歴史 46杯目 「教科書の読み方」
- 海・花火の話
担当:水島(2C、MC)、木下(3EI、MIX)、西島(2EI)、西村(F2)、西(教員)
絶対PATH,相対PATHの演習
絶対PATH,相対PATHの理解のため、コマンドラインを用いた演習も行う。
ファイル関連コマンドの基本
(( まずは cmd.exe の起動 )) メニュー検索より、"cmd.exe" を探して起動 (( ファイル操作命令の基礎 )) dir PATH ディレクトリの一覧を表示 例:dir C:¥Windows type PATH ファイルの内容を表示 例:type Z:¥sample¥sample.c mkdir PATH ディレクトリを作成 例:mkdir Z:¥foo rmdir PATH ディレクトリを削除 例:rmdir Z:¥foo echo "abc" > Z:¥sample¥data.txt テキストファイルに出力
演習
(( 絶対PATH )) Z: dir ¥ mkdir ¥fukui echo "fukui" > ¥fukui¥fukui.txt type ¥fukui¥fukui.txt mkdir ¥fukui¥sabae echo "sabae" > ¥fukui¥sabae¥sabae.txt dir ¥fukui¥sabae type ¥fukui¥sabae¥sabae.txt (( 相対PATH )) cd ¥fukui¥sabae dir . dir .. type sabae.txt type ..¥fukui.txt dir ..¥..
ファイル入出力
今日は、ファイル入出力のプログラム演習。
ファイル入出力
// 基礎的なファイル入力 #include <stdio.h> void main() { FILE* fp ; if ( (fp = fopen( "data.txt" , "rt" )) != NULL ) { char name[ 100 ] ; int age ; while( fscanf( fp , "%s%d" , name , &age ) == 2 ) { printf( "%s %d\n" , name , age ) ; } fclose( fp ) ; } }
// 入力したデータから条件を満たすデータだけを出力 #include <stdio.h> void main() { FILE* fp_in ; FILE* fp_out ; if ( (fp_in = fopen( "in.txt" , "rt" )) != NULL ) { if ( (fp_out = fopen( "out.txt" , "wt" )) != NULL ) { char name[ 100 ] ; int age ; while( fscanf( fp_in , "%s%d" , name , &age ) == 2 ) { if ( age >= 18 ) fprintf( fp_out , "%s %d\n" , name , age ) ; } fclose( fp_out ) ; } fclose( fp_in ) ; } }
テキストモードとバイナリモード
前述プログラムでは、fopen のファイルモードで、"rt" , "wt" のように 文字"t"をつけている。これは、OSによる行末文字の取り扱いの トラブルを防ぐためのもの。
OSの成り立ちの違いで、Windows と Unix では、行末文字の取り扱い方法 が違う。
Windows では、次の行の先頭に移動するには、"\r"(キャリッジリターン)と "\n"(ラインフィード)が必要となる。
一方、Unix では、次の行の先頭に移動するには、"\n"(ラインフィード)だけ でいい。
この違いがあるため、Unixで開発されたC言語で書いたプログラムを Windows で動かそうとすると、
// Unix Windows printf( "Hello\n" ) ; // Hello Hello printf( "World\n" ) ; // World World
と異なる表示になってしまう。これでは、WindowsでC言語を書く場合は、 printf( "Hello\r\n" ) といった書き換えが必要になってしまう。
これを防ぐために、fopen で "…t" 書くことで「テキストモード」に 指定すると Windows で printf( "\n" ) を出力すれば、 "\r\n" に変換して出力してくれる。入力時にも同様に、"\r\n" があると、 "\n" に変換してくれる。
絶対PATHと相対PATH
前述のプログラムで、fopen( "data.txt" , "rt" ) と指定すると、 プログラムの保存しているディレクトリと同じ場所から、"data.txt" を 探そうとする。(相対PATH)
しかし、別のディレクトリにあるデータを読む場合には、 場所を明記するために、Z:\directory\data.txt のように、 ルートディレクトリからの場所(Windowsではドライブ名付きで)を 指定する。(絶対PATH)
ただし、Windows でのディレクトリ区切り文字 '\' は、C言語の文字列内では、 特殊文字を指定する時に使われる。このため、文字列内では \\ の様に 書く必要がある。
fp = fopen( "Z:\\directory\\data.txt" , "rt" ) ;
この場合、"\\"と2重で書くことで、Unix と Windows のプログラムの 書き換えが必要となるのを防ぐため、上例は、Unixのディレクトリ区切り文字"/"を使って、以下のように書いても良い。
fp = fopen( "Z:/directory/data.txt" , "rt" ) ;
2016年7月10日(第483回)
収録でお送りしました。
- 高専地区体育大会の話
- 夏の話
- ジャズバー歴史 45杯目 「みんなで歌うこと」
- 七夕の話
担当:小藤(3B、MC)、松島(5C、MIX)、田嶋(3C)、鷲田(2EI)、西(教員)
2016年7月3日(第482回)
- 夏の過ごし方
- テストの話
- 梅雨の過ごし方
- ジャズバー歴史 44杯目 「学徒動員」
- 1年生の初の生放送
担当:川﨑(3EI、MC)、西島(2EI、MIX)、増永(1EI)、中村(教員)