ホーム » スタッフ » 斉藤徹 » 講義録 » プログラム応用

プログラム応用」カテゴリーアーカイブ

2019年9月
« 8月    
1234567
891011121314
15161718192021
22232425262728
2930  

最近の投稿(電子情報)

アーカイブ

カテゴリー

CTF講座・K-SEC第3ブロック学生向け講習会に参加

高専機構の情報セキュリティ人材育成プロジェクトの一環として、岐阜大学サテライトキャンパス(岐阜高専主幹)にて8/28(水)に開催された、CTF講座・K-SEC第3ブロック学生向け講習会に3EI学生1名が参加しました。

CTFとは

CTFとは、Capture The Flags という、情報セキュリティの知識を使ってクイズを解く競技です。

例えば、簡単なものでは、

  1. PGS{fnzcyr} からフラグを見つけよ。# rot13暗号化
  2. SQLインジェクションでデータ漏洩が発生するWebシステムが用意されていて、SQLインジェクションが発生するようなデータを入力させて情報を見る。

といった問題があります。複雑な問題では、

  1. C言語で生成された機械語があって、通常では何も表示されないけど、逆アセンブルして条件判断の一部をバイパスさせて、データを表示させる。

といった、OSや機械語の知識が要求されるものもあります。

初心者には大変だったかな

今回、4年はインターンシップなどで参加者があつまらず、初心者の3年の学生さんに参加してもらいました。CTFの初心者向け講習会ということで、基礎的演習もあるかと思いましたが、いきなりの簡易版CTF大会となりました。知識が不足していて、苦労していましたが基礎的問題をいくつか解けていたようです。

最後に、講習会の修了証をもらいました。

簡単テストの解説

前に実施した簡単テストの答え。

キーワードの理解

型の理解

上記の問題だけでは、説明しきれないので、下図左のプログラムと、その printf() で表示するデータの型を示す。

型の意味を考えたうえで、何が表示されるか考えよう。

関数の理解

簡単テスト

情報構造論のテストにて結果は両極端な成績。苦手な人は基本理解が怪しいみたい。ということでC言語の理解の確認。

キーワードの理解

以下のプログラムの下線部 A-I の各単語を説明するのにふさわしいものを、(a)~(f)で選べ。キーワードは予約語と呼ばれることも多い。

(a) 型を表すキーワード、(b) キーワード、(c) 変数名、
(d) 関数名、(e) ファイル名、(f) それ以外

解答欄

A_____, B_____, C_____, D_____, E_____,

F_____, G_____, H_____, I_____

型の理解

以下のプログラムの下線部 A-D の型を答えよ。

(a) int , (b) int型へのポインタ, (c) char, (d) char型へのポインタ, (e) void

解答欄

A_____, B_____, C_____, D_____

関数の理解

以下のように、文字列を src から dest にコピーする(ただし最大文字数 countまで) strncpy を作った。
この関数の下線に示す仮引数部分を完成せよ。

解答欄________________________________

構造体を使ったプログラム例

今日はテスト前で、構造体の全体的な説明も終わり、演習の時間。 以下のようなオブジェクト指向の考え方を取り入れた、 構造体ポインタ渡しのスタンダードなプログラムを示す。

#include <stdio.h>
#define SIZE 10
struct Person {
   char  name[ 20 ] ;
   int   age ;
} ;
int read_Person( struct Person* p ) {
   return scanf( "%s%d" , p->name , &(p->age) ) == 2 ;
}
void print_Person( struct Person* p ) {
   printf( "%s %d\n" , p->name , p->age ) ;
}

int main() {
   int i , size ;
   struct Person table[ SIZE ] ;
   // データの入力処理
   for( i = 0 ; i < SIZE ; i++ ) {
      if ( !read_Person( &( table[i] ) ) )
         break ;
   }
   size = i ;
   // データの出力処理
   for( i = 0 ; i < size ; i++ )
      print_Person( &( table[i] ) ) ;
   return 0 ;
}

ファイル入出力にも慣れてもらおう

#include <stdio.h>
#define SIZE 10
struct Person {
   char name[ 20 ] ;
   int  age ;
} ;
int read_Person( struct Person* p , FILE* fp ) {
   return fscanf( fp , "%s%d" , p->name , &( p->age ) ) == 2 ;
}
void print_Person( struct Person* p , FILE* fp ) {
   fprintf( "%s %d\n" , p->name , p->age ) ;
}
int main() {
   int    i , size ;
   struct Person table[ SIZE ] ;
   FILE*  fp_in ;

   if ( (fp_in = fopen( "data.txt" , "rt" )) != NULL ) {
      for( i = 0 ; i < SIZE ; i++ )
         if ( ! read_Person( &( table[i] ) , fp_in ) ) {
            size = i ;
            break ;
         }
      for( i = 0 ; i < size ; i++ )
         print_Person( &( table[i] ) , stdout ) ;
   }
   return 0 ;
}

オブジェクト指向っぽく

#include <stdio.h>
#define SIZE 10
class Person {
private:
   char  name[ 20 ] ;
   int   age ;
public:
   int read() {
      return scanf( "%s%d" , name , &age ) == 2 ;
   }
   void print() {
      printf( "%s %d\n" , name , age ) ;
   }
} ;
int main() {
   int size ;
   Person table[ SIZE ] ;

   for( int i = 0 ; i < SIZE ; i++ )
      if ( !table[i].read() ) {
         size = i ;
         break ;
      }
   for( int i = 0 ; i < size ; i++ )
      table[i].print() ;
   return 0 ;
}

今日のプログラミング応用のテスト問題

今日の、本科3年のプログラミング応用のテスト問題。
# テスト後、「先生、ポケモンGOやってるんですか?」

今から、明日の専攻科2年オブジェクト指向プログラミングの問題作るぞ。 当然、ポケモンの「進化」ネタだよな。

1607271053_859x300.png

安全な入力とdefineマクロ

ファイル処理の最後の説明で、バッファ・オーバーフローと、安全な入力について説明。

安全な入力

一般的なC言語での文字列入力のプログラムは、以下の様なものがテキストにも書かれている。

// memory
// [局所変数str][戻り番地][..........]
void foo() {
   char str[ 10 ] ;
   scanf( "%s" , str ) ;
}

バッファオーバーフロー

しかし、こういった処理は極めて危険である。 入力の際に、10文字以上のデータが入力された場合、 一般的な処理系では、str[] の配列の近辺に 「関数foo()の実行後に戻る処理の番地」が格納されている場合が多く、 文字列をはみ出るような入力があった場合、処理番地を書き換えられる可能性がある。 悪意のあるプログラマーは、はみ出す領域に、戻り番地を書き換えるデータと、悪意のある処理を 書くことで、想定外の処理を動かすかもしれない。 このテクニックをバッファオーバーフローと呼ぶ。

このため、最大文字制限の機能を使い、以下のように記述すべきである。

char str[ 10 ] ;
scanf( "%9s" , str ) ;

しかし、scanf() には、空白を読み飛ばす機能により「入力が無い場合…」といった 処理が書きにくい、%d入力で実数の"."や文字列を間違って入力したときの処理などの 問題があって、scanf() 単体で複雑な入力に対応することは極めて難しい。

fgets() + sscanf()

このような場合によく使われるのが、fgets()とsscanf()である。

fgets() は、文字配列に1行分のデータ(行末文字"¥n"まで)を、文字配列に読み込む関数である。 また、sscanf() は、文字配列のデータから、scanf() と同じようにデータを読み込む。

FILE* fp ;

if ( (fp = fopen( "data.txt" , "rt" )) != NULL ) {
   char buff[ 100 ] ;
   while( fgets( buff , sizeof( buff ) , fp ) != NULL ) {
      int x ;
      double y ;
      char z[100] ;

      if ( sscanf( buff , "%d%lf%s" , &x , &y , z ) != 3 )
         break ;
      // x , y , z を使った処理
   }
   fclose( fp ) ;
}

fgets() は、第一引数に、読み込み先の配列アドレス、第2引数に最大読み込みバイト数、第3引数に 読み元のファイルを指定する。文字配列への読み込み時には、第2引数のサイズを超えて 読み込むことはしないので、バッファオーバフローの心配はない。 また、入力データが無い場合には、NULL を返す。
sizeof()は、引数部分の変数のバイト数を返す演算子。

sscanf() は、データの入力が、第一引数の文字列から読み込む以外は、 scanf(),fscanf() と同じ使い方。

注意:fgets では、入力が最大バイト数以下の場合、行末文字まで読み込む。


Tips: 入力が無かったら(空行なら)、標準入力(通常キーボード入力)なら

char buff[ 1024 ] ;

while( fgets( buff , sizeof( buff ) , stdin ) != NULL ) ) {
   // stdin は、標準入力(通常キーボード)
   if ( buff[ 0 ] == '¥n' ) {
   // 入力が空行だった場合
   }
}

fscanf()にfprintfがあるように、sscanfに対してsprintfもある。

char buff[ 1024 ] ;

sprintf( buff , "%d %5.1lf %s" , 12 , 34.5 , "abc" ) ;
// buff = "12  34.5 abc"となる。

#defineマクロ

scanfで"%d"で数字を入力する際に、文字を入力されると、あとの処理が書きにくい場合が多い。 この場合、fgetsで入力し入力データが正しい文字を使っているかチェックしてから、 sscanf()を使うなどの対処をとることが多い。 ここで、#define マクロを使ってみる

#include <stdio.h>
#define isdigit(C) ((C)>='0' && (C)<='9')
void main() {
   char buff[ 1024 ] ;
   while( fgets( buff , sizeof( buff ) , stdin ) != NULL ) {
      char* pc ;
      for( pc = buff ; *pc != '¥0' && isdigit( *pc ) ; pc++ )
         /*nothing*/ ;
      if ( *pc == '¥n' || *pc == '¥0' ) {
         int x ;
         sscanf( buff , "%d" , &x ) ;
      }
   }
}

#define は、通常プログラム中の定数を分かりやすく使う場合に、使われる。

#define PI 3.14159265

ただし、#で始まる行は、C言語によって特殊で、C言語の解析の前に「プリプロセッサ」 でプログラムの内容を書き換える機能。

C言語のプログラムが機械語になるまで:

 C言語(#行を含む)
  ↓ プリプロセッサ
 C言語(#行なし)
  ↓コンパイル
 中間コード(printfなどの標準関数などが未解決)
  ↓
 リンク処理ライブラリ(標準関数などの中間コードをまとめたもの)
  ↓
 機械語

#define マクロでは、isdigit() の引数? C が、呼び出し部の *pc となり、 isdigit( *pc ) の部分は、以下のように書き換えられる。

((defineマクロ宣言))
#define isdigit(C) ((C)>='0' && (C)<='9')

((デファインマクロを使ったら))
isdigit(*pc)
↓ C ← *pc
((*pc)>='0' && (*pc)<='9')

ただし、#defineマクロは、プログラムのコンパイル前に、文字列として書き換えを行う。

// 例1
#define begin {
#define end }
void main() // まるでPASCALのような記述(^_^;
begin
   printf( "Hello¥n" ) ;
end         // 正しく動くよ
// 例2
#define ADD(X,Y) X + Y
#define MUL(X,Y) X * Y
void main() {
   printf( "%d" , MUL( 3 , ADD( 4 , 5 ) ) ) ;
}
// 3 * 4 + 5 に書き換えられるので、17になる。
// 3 * (4+5) の27にはならない。
// 普通の関数のように27の結果が欲しいなら、
// #define ADD(X,Y) ((X)+(Y))
// #define MUL(X,Y) ((X)*(Y))
// と書くべき。

開いた関数と閉じた関数

#defineマクロは、定義しておいた命令への書き換えなので、関数と同じように思うかもしれない。 ただし、機械語を生成する処理の前に書き換えるので、#define マクロで書き換えられる処理が 長い場合は、生成される機械語が大きくなる場合がある。 一方で、#defineマクロを使うと引数の受け渡しが無いので、 isdigit()のような簡単な処理の場合、 生成される機械語の処理が少し速い。

// 開いた関数FOO
#define FOO(X) Xを使った処理
void main() {
   int x ;

   FOO(x) ;  // xを使った処理
   FOO(x) ;  // xを使った処理
   // FOOの中身が長い場合、FOOの機械語が2個作られる。
}
// 閉じた関数foo
int foo(int z) {
   zを使った処理
   :
   :
}
void main() {
   int x ;
   foo(x) ; // z←x,fooを呼び出し
   foo(x) ; // z←x,fooを呼び出し
   // fooの機械語は1個だけ,引数の受け渡し処理が2個
}

#defineマクロのADD,MULの優先順位の問題が、"醜い"と思う人は、 C++で新しく導入された、"inline"関数を勉強すること。 #defineマクロを使わずに、開いた関数を簡単に記述できる。

絶対PATH,相対PATHの演習

絶対PATH,相対PATHの理解のため、コマンドラインを用いた演習も行う。

ファイル関連コマンドの基本

(( まずは cmd.exe の起動 ))
メニュー検索より、"cmd.exe" を探して起動
(( ファイル操作命令の基礎 ))
dir PATH  ディレクトリの一覧を表示
 例:dir C:¥Windows
type PATH ファイルの内容を表示
 例:type Z:¥sample¥sample.c
mkdir PATH ディレクトリを作成
 例:mkdir Z:¥foo
rmdir PATH ディレクトリを削除
 例:rmdir Z:¥foo
echo "abc" > Z:¥sample¥data.txt テキストファイルに出力

演習

(( 絶対PATH ))
Z:
dir ¥
mkdir ¥fukui
echo "fukui" > ¥fukui¥fukui.txt
type ¥fukui¥fukui.txt
mkdir ¥fukui¥sabae
echo "sabae" > ¥fukui¥sabae¥sabae.txt
dir ¥fukui¥sabae
type ¥fukui¥sabae¥sabae.txt
(( 相対PATH ))
cd ¥fukui¥sabae
dir .
dir ..
type sabae.txt
type ..¥fukui.txt
dir ..¥..

ファイル入出力

今日は、ファイル入出力のプログラム演習。

ファイル入出力

 // 基礎的なファイル入力
#include <stdio.h>
void main() {
   FILE* fp ;
   if ( (fp = fopen( "data.txt" , "rt" )) != NULL ) {
      char name[ 100 ] ;
      int age ;

      while( fscanf( fp , "%s%d" , name , &age ) == 2 ) {
         printf( "%s %d\n" , name , age ) ;
      }
      fclose( fp ) ;
   }
}
 // 入力したデータから条件を満たすデータだけを出力
#include <stdio.h>
void main() {
   FILE* fp_in ;
   FILE* fp_out ;

   if ( (fp_in = fopen( "in.txt" , "rt" )) != NULL ) {
      if ( (fp_out = fopen( "out.txt" , "wt" )) != NULL ) {
         char name[ 100 ] ;
         int  age ;

         while( fscanf( fp_in , "%s%d" , name , &age ) == 2 ) {
            if ( age >= 18 )
               fprintf( fp_out , "%s %d\n" , name , age ) ;
         }
         fclose( fp_out ) ;
      }
      fclose( fp_in ) ;
   }
}

テキストモードとバイナリモード

前述プログラムでは、fopen のファイルモードで、"rt" , "wt" のように 文字"t"をつけている。これは、OSによる行末文字の取り扱いの トラブルを防ぐためのもの。

OSの成り立ちの違いで、Windows と Unix では、行末文字の取り扱い方法 が違う。

Windows では、次の行の先頭に移動するには、"\r"(キャリッジリターン)と "\n"(ラインフィード)が必要となる。

一方、Unix では、次の行の先頭に移動するには、"\n"(ラインフィード)だけ でいい。

この違いがあるため、Unixで開発されたC言語で書いたプログラムを Windows で動かそうとすると、

                       // Unix    Windows
printf( "Hello\n" ) ; // Hello    Hello
printf( "World\n" ) ; // World         World

と異なる表示になってしまう。これでは、WindowsでC言語を書く場合は、 printf( "Hello\r\n" ) といった書き換えが必要になってしまう。

これを防ぐために、fopen で "…t" 書くことで「テキストモード」に 指定すると Windows で printf( "\n" ) を出力すれば、 "\r\n" に変換して出力してくれる。入力時にも同様に、"\r\n" があると、 "\n" に変換してくれる。

絶対PATHと相対PATH

前述のプログラムで、fopen( "data.txt" , "rt" ) と指定すると、 プログラムの保存しているディレクトリと同じ場所から、"data.txt" を 探そうとする。(相対PATH)

しかし、別のディレクトリにあるデータを読む場合には、 場所を明記するために、Z:\directory\data.txt のように、 ルートディレクトリからの場所(Windowsではドライブ名付きで)を 指定する。(絶対PATH)

ただし、Windows でのディレクトリ区切り文字 '\' は、C言語の文字列内では、 特殊文字を指定する時に使われる。このため、文字列内では \\ の様に 書く必要がある。

 fp = fopen( "Z:\\directory\\data.txt" , "rt" ) ;

この場合、"\\"と2重で書くことで、Unix と Windows のプログラムの 書き換えが必要となるのを防ぐため、上例は、Unixのディレクトリ区切り文字"/"を使って、以下のように書いても良い。

 fp = fopen( "Z:/directory/data.txt" , "rt" ) ;

プログラミング応用・ガイダンス

初回の授業ということで、シラバスを配り、今年の授業の進め方を説明。 基本はC言語で行い、(1)C言語の基本、(2)ファイルと入出力、(3)構造体 の説明を行う。

今年の3年生は、JavaScript でプログラミング基礎を行っているので、 C言語に慣れてもらう必要がある。特に型(Type)の概念ができていないと 思われるので、注意が必要と思われる。

プログラム言語の歴史

まずは、JavaScript を習ってきたのに、C言語をするのかを分かって もらうために、プログラム言語の歴史の説明を交えて、 構造化プログラミングの説明。

 機械語         計算方法や番地がそのまま数値...
アセンブリ言語 機械語は人間に解らないので書きやすく。
FORTRAN    科学技術計算向け言語
COBOL     商用計算向け言語(データの構造化[構造体])
ALGOL     命令の構造化 + データ構造化
while( ) { C言語の命令の構造化
}
BCPL,B言語     C言語の前身
C言語          unixを開発するために作られた
SIMULA         シミュレーション用言語(オブジェクト指向の前身)
C++            C言語にオブジェクト指向を取りれ
Java           Internetでのプログラム用
C#             Microsoftの対Java戦略
D              BCPL,B,C,C++,今ココ
JavaScript     ブラウザで動くように

前述の高級言語を動かす場合、コンパイラ方式とインタプリタ方式がある。 コンパイラ方式は、命令を最初にすべて機械語に直す。 インタプリタ方式は、高級言語の意味に合わせて動く言語。 通常は、コンパイラ方式の方が高速。

C言語の導入

 #include <stdio.h>
int main() {
   printf( "Hello World\n" ) ;
   return 0 ;
}

と説明をしようと思ったけど、記号の読み方とか読み間違いを防ぐため

 # ナンバーサイン(正しくはシャープではない)
: コロン
; セミコロン
@ アット
^ ハット
* アスタリスク

あと、私の板書を読み間違えられても困るので、紛らわしい文字の 話をしておく。

GrWinのライセンスキーの指定方法

プログラミング応用のグラフィックスを用いた演習では、 簡単な設定で使えるようにということで GrWin を使用している。 しかし、昨年度まで利用していたものから、正式バージョン GrWin 1.0 となった際に、 ライセンスキーが必要となった。

GrWinのライセンスキーの設定

総合情報処理センターでは、複数端末の教育利用ライセンスを取得し、 そのキーの情報が端末に保存されています。 プログラムを走らせる場合は、以下のようなコードにてコンパイルして下さい。

#include <GrWin.h>

#include "C:\Program Files\GrWin\gwkey.c"

int main(){
   GWinit();
   GWopen(0);
   GWindow(-1,-1,1,1);
   GWline(-1,-1,1,1);
   return 0;
}

// 以下の C:¥Program Files¥GrWin¥gwkey.c" は、保存済み //
/* gwkey.c
*
* Copyright (C) 1998 - 2014  TAMARIBUCHI, Tsuguhiro
*
* WWW: http://spdg1.sci.shizuoka.ac.jp/grwin/ja-jp/
*
**********************************************
* GrWin Version 1.1.0 用のキー・ファイルです *
*      このファイルを編集しないでください    *
**********************************************
*/
char GW_key[] = "ライセンスキーの値";

自宅で GrWinを使って演習を行いたい場合は、必要な GrWinサーバインストーラ(非商用)GrWinライブラリインストーラ、をダウンロード&インストールし、 個人用ライセンス取得ページにて、ライセンスを発行し送られてきたキーを、上記 "C:¥Program Files¥GrWin¥gwkey.c" の GW_key[] の文字配列に記載してください。