2012年1月17日火曜日

2011年度後期 情報処理実習(応用)II 授業記録(旧ブログより移転記事)


第15回 1月17日(火)4限

・受講生全員が欠席。
・秋学期、これにて終了…。残念。


第14回 1月10日(火)4限
・受講生全員が欠席。そのため今日の授業はお流れ…。
・今日から2回分でVBAプログラミング入門の予定だった。今日は「プログラムとは」「プログラム・OS・ハードウェアの関わり」「開発工程(要件定義からリリースまでの6段階)」「VBAの概略」までをざっと30分ぐらいで説明して、それからExcel VBAでMsgbox, Dim, InputBox, さまざまなメッセージボックス(vbAbortRetryIgnore + vbExclamationなど) を作って遊んでみるという予定にしていた。そして来週の予定が条件分岐と繰り返し、Excelマクロの記録とVBA、簡単なユーザーフォーム、簡単なユーザー定義関数を作るという予定だったが、2回分の授業でもギリギリなところ、最終週の来週だけではもはやどうしようもないという状況。仮に来週、授業が成立するとしても、1回だけでは何をやったらよいのか…。ま、いいけど…。


第13回 12月20日(火)4限
・久しぶりに受講生全員が出席。2名だけど。
・M君のリクエストにより、今日のテーマはかな漢字変換の裏側。もう少し幅広く言語処理技術についても関連する内容を扱うことにした。
・「かれのくるまでまつ」「このひとことでげんきになった」「浮き輪でこわごわ浮いた」「クロールで泳いでいる少女を見た」「望遠鏡で泳いでいる少女を見た」「ナイフで歩いている人を刺した」「早足で歩いている人を刺した」「黒い瞳の大きな男の娘」などを用例としながら、コスト最小法、形態素数最小法、文節数最小法、未知語の扱いなどについて概説。続いてこれらをウェブ上のKNPで構文解析して構造を比較した。
・また、別の用例として、たまたま今日の午前中にツイッターで話題になっていた「おにぎりおにぎりちょいとつめて」か「おにぎりを握りちょいとつめて」かの話からウィキペディアの「ぎなた読み」の話に入り、ここで書かれているいくつかの用例を形態素解析構文解析してみる実習。形態素解析の失敗例なども検討した。
・最後に日本語WordNetの紹介。
・第11回~第13回のテーマの中から任意の内容で次回授業時までにA4用紙1枚程度のレポート課題を指示。


第12回 12月13日(火)4限
・M君のみ出席。もうY君は来なくなってしまったのだろうか。ということで受講生一人だけの授業。
・前回の資料の続き。3つめの課題は形態素解析を用いたアンケートの自由記述欄の分析を実習。サンプルとして使えるものでネット上に転がっている自由記述欄が豊富なアンケート結果を「アンケート 自由記述」というキーワードで検索して3種類ほどテキストファイルに加工。このサンプルファイルを探してくる途中で、同様の手法で分析をするという趣旨の学会発表論文などがいろいろ見つかるが、さすがにこういうところではもっと高度なテキストマイニング用のソフトが使われている様子だった。(この授業ではピボットテーブルの応用という意味もあるので、敢えて手間のかかる方法も取り入れている。)
・前回と同様の手法で形態素解析した結果をピボットテーブルで処理し、頻度順の語彙リストを作成。その中でいくつかのキーワードを探し出し、AntConcでKWICコンコーダンスを表示し…という手順をやろうとして少し段取りを間違えてしまった。KWICコンコーダンスで分析するには形態素ごとにスペースで区切っておいた方がよかったのだが、その手順を資料に加えるのを忘れていた。しかもサンプルで用意したファイルの文字コードの問題があり、AntConcの利用は途中であきらめ、サクラエディタでのGrep検索に切り替えた。こちらは特に問題なく、いろいろな高頻度語がどんな文脈で使われるかを調べることができた。
・4つめの課題は日本語で一番よく使われるひらがな、カタカナ、漢字は何かという実習。任意のテキストを正規表現で (.) を \1\n に置換する方法で1行1文字にし、同様にピボットテーブルで数えた。サンプルには日本国憲法の全文を使ったが、あまり適切なデータではなかったのかもしれない。
・そうこうしているうちにほとんど時間がなくなってしまったので、最後の10分程度でこのあとの3回の授業で何をやるのかを相談。実質3回分の授業が飛んでしまっているので、今後予定している内容の中から関心のあるテーマを選んでもらうことにした。結局、次回は仮名漢字変換に絡めた言語処理技術の概略などを、また年明けの2回はVBAプログラミング入門をそれぞれ扱うことにした。


第11回 12月6日(火)4限
・M君のみ出席。1名だけ。前回流れてしまったので、その教材をそのまま利用。今日のテーマはテキストマイニング入門その1。
テキストマイニングの概念と形態素解析の話を少しだけ説明してから、実習を2つ。
・1つ目の実習として用意したのは、衆議院会議録から任意のものをテキストファイルで保存し、WinChaで表層語のみで形態素解析し、結果をExcelに貼り付けてピボットテーブルで高頻度語を探す作業。自分がサンプルとして提示したのは東日本大震災復興特別委員会の会議録から、高頻度語として「復興」「被災」「総理」の頻度と全体に対する割合を計算した結果。学生は外務委員会の議事録から高頻度語として「国務大臣」「沖縄」「民主党」で調べていた。これらが東日本大震災復興特別委員会の会議録でも出てくるかどうかを比較してみたら、いずれもかなり頻度は低かった。この違いについての解釈をいくつか紹介。
・2つ目の実習として用意したのは、青空文庫から任意の作家の作品をテキストファイルで保存し、WinChaで形態素解析し、Excelに貼り付けた作業結果のうち、発音の欄を表層語と比べることで漢字含有率を調べる課題。サクラエディタ上で正規表現を使って全角括弧に入った文字列(.+)を全置換することでルビを削除したものをWinChaで処理。発音欄はカタカナで出力されるので、それをひらがな表記に直すため、Excelのうち、発音の列(C列)だけをサクラエディタに貼り付けてひらがな置換。続いてExcel上で =if(A1=C1,0,1)というような式を右側の空いた列に入れて下方向コピーし、各行の表層語と発音が一致するかどうかを判定。画面下部に現れるデータの個数と合計(漢字の場合は1が入るので、単純にそれを足し併せた数が漢字が使われた件数となる)によって漢字含有率を計算。サンプルとして提示したのは「吾輩は猫である」で32.5%。学生が行ったのは「銀河鉄道の夜」で25%程度だった。また「風の又三郎」でも同様に25%程度だったため、ここから文体の違いなどについてどのように解釈ができるかを考えさせた。
・次回は高頻度語をAntConcでKWICコンコーダンスで表示する実習と、日本語で一番よく使われるひらがな、カタカナ、漢字を探す実習を行う。これに加えて正規表現の基本的な部分についても紹介する予定。


第10回 11月29日(火)4限
・受講生が2名とも欠席。残念ながら授業なし。今日のテーマは今年度から初めて扱う新ネタだったので張り切って資料を作ってきたのになあ…。
・今日から4回でテキストマイニングコーパス言語学、さらに続く2回でVBAプログラミング入門をやるつもりなのだが、ここで1回欠けるともう全く時間が足りない。どこをどう削るか迷う…。


第9回 11月22日(火)4限
・受講生2名とも出席。前回見たPresentation ZenのDVD内容に相当する箇所を書籍版を書画カメラで提示しながらざっと復習。その後、約30分間、DVDの続きを見る。今回はデザインと発表方法について。
・そのあとで前回時間が足りなくて説明できなかった「わかりやすく伝える技術」に関するスライドの続きを提示して「情報処理の原理」についての話を紹介。学歴と情報処理スキルの関係の話も。
・25分程度、作業時間。Presentation Zenの発想を取り入れるかどうかは別として、前回作りかけたスライドの続きを完成させる。終わらなければ宿題という条件。次回ファイルを回収予定。
・最後の10分間でPowerPoint 2010の新機能について簡単に紹介。Youtubeから埋め込みコードを取得してPowerPointスライド上に貼り付ける方法について演習。
・次回からの2回はがらっとテーマが変わってテキストマイニング入門。予告として「仮名漢字変換機械翻訳の裏側の話」を行うと伝えたが、ひとまずWinChaを使った形態素解析とテキスト中の漢字含有率などを求める実習を行う予定。今年度から扱う新テーマなので一から資料を作らなければ…。


第8回 11月15日(火)4限
・受講生2名とも出席。今日から2回のテーマはPowerPoint。180分でPowerPointの中級利用というテーマを扱うが、例年通りこの単元では池上彰 著 講談社現代新書『わかりやすく<伝える>技術』pp.106-108より「社内会議の短縮を提案する」という3分間でプレゼンを行うという台本をもとにスライドを作成する課題。約50分。(一般的に情報処理実習のPowerPointの単元では教科書と同じものを作るとか、自己紹介の延長みたいな内容を作ることが多いが、それではあまり面白くないので。)
・その後、本当に台本の内容が3分で読めるかという点を実演。3分以内となると超高速の早口でしか読めないし、伝わらないことを説明。(うっかり速く読みすぎてしまい、2分40秒で終わったのは失敗。)続いて、同書の「わかりやすく伝える技術」の中から抜粋した内容を説明しながら、池上案のスライドに少々味付けしたものを提示。スライドの続きは次回に利用。
・最後の20分間でPresentation ZenのDVDを見る。今週はChapter 1とChapter 2。次回、残りの部分を見る。PowerPointでいきなりスライドを作るのではなく、準備段階こそが大切ということは伝わっただろうか?準備段階の進め方の例としてマインドマップの利用についても少しだけ紹介。


第7回 11月8日(火)4限
・受講生全員が時間通りに集合。2名だけだけど。
・両名のExcelに関する進度が不ぞろいなので、最初の約60分は教科書会社から学内ライセンス提供してもらっているExcel自習教材で各自が好みのレベルで学習しながら質問対応。
・この科目の趣旨として、Wordだけ、Excelだけといった形ではなく、とにかくいろんな内容を少しずつやってコンピュータの可能性を知るということを目的にしているので、Excelでも高度な使い方として、フィルタとピボットテーブルの概略を30分ほどかけて説明と実習。もっと知りたければ応用IVの授業を、ということだが、実際にこの授業の受講生のうちの一人は同時履修中。
・来週から2回でPowerPoint。シンプルなスライドとグラフィカルなスライドだが、シンプルなスライドの例としてプレゼンテーションZenについても紹介する予定。


第6回 11月1日(火)4限
・授業開始時に誰も教室に来ておらず、開店休業状態が危ぶまれたが、5分ほど遅刻でY君が到着。1名だけなので彼のペースに合わせて授業。
・彼はたまたま5限の情報処理実習(応用)?の受講生でもあるので、欠席した週の応用?の内容でも応用?のための内容でも、好きなことをやってよいことにした。
・欠席週の応用?の素材として用意していた掛け算九九の表を絶対参照と相対参照を区別しながら作る課題と、ifとvlookupを組み合わせて用紙サイズを求める課題を実施。前者は簡単にクリア。後者はvlookupの式の作り方が難しかった様子。
・続いて応用?の欠席週の教科書の内容にチャレンジ。
・ここで追加課題としてデータバーを使って人口ピラミッドを作る練習素材をその場で用意。この課題も比較的簡単にクリア。
・続いて応用?の練習素材のうち、問題06(書式の活用)にチャレンジ。ちょうど応用?の欠席週の内容とも類似。ここでは条件付き書式の設定に苦労した様子だったが、応用?の方の教科書も参考にしながらクリア。でも、ユーザー定義の表示形式で、日付の入ったセルに aaa と入れると曜日が漢字1文字で、また aaaa と入れると「火曜日」みたいな形で表示されるのはやっぱり腑に落ちない。なぜ aaa や aaaa なんだろう。
・最後に応用?の練習素材のうち、問題04(関数)から、countifやvlookupなどの関数を使う課題にチャレンジ。vlookup関数で第4引数が省略できないタイプの問題(参照先の表の1列目が文字の場合はFALSEをつけて完全一致にしなければならない)で最後につまづいたけど、これは高度すぎる内容だったかな。
・来週はグラフの作成、ピボットテーブル、Wordとの連携などの基本的な操作を扱う予定。(問題07~問題12あたり)


第5回 10月25日(火)4限
・出席率100%!…受講生が二人しかいないから簡単に達成できるのだけれど。(むしろ達成してもらわないとちょっと困る。)
・前回までの内容を踏まえて、Word上でスクリーンショットを使った課題を自由に作成。50分間の実習のあとで、10分間ほど補足事項などを説明。
・最後の30分間はExcel。2名のレベルが少々異なっているので、教科書会社から学内ライセンス提供してもらっているExcelの自習用教材を各自のペースで進めながら、個別に質問など対応。
・来週・再来週もおおむね同様の流れを予定。
・大学指定の授業アンケートを行うことになっているが、2名しかいないので口頭にて聞き取り調査。2名とも「この授業の内容をよく理解できていると感じる。」「この授業の内容に学びの面白さを感じている。」と回答。(誘導尋問っぽくなっていなければ良いが…。)また、授業の進め方等についての希望で、パソコン検定対策も扱ってほしいという要望が寄せられた。去年は同一科目でパソコン検定対策も少しだけやったが、今年はシラバスには加えていなかったので、11月末あたりにでも2回分ほど内容を差し替えることにしよう。


第4回 10月18日(火)4限
・前回はY君1名のみが出席だったが、今回はM君1名のみが出席。受講生が二人しかいないクラスで交互に欠席されると痛い。仕方ないので、前回とほぼ同一の内容に。この時点でもはやシラバス通りの授業展開は絶望的となった。
・タブの使い方を忘れている様子だったので、その補習。中黒を使って項目を連結する場合とリーダーを使う場合の区別。
・ページ罫線を使った外枠の追加
・行頭のタブが勝手にインデントになってしまう件 対処法:何か文字を入れておいてタブでそろえる。次に行頭でその文字をdeleteする。
・途中から段組みを変えるには…? 対処法:セクション区切りを入れる。次にセクションごとに段数を変える。段区切り=段組みの中で強制的に改段位置を変える。
・プリント資料に基づき、PrintScreenの使い方とOffice 2010の新機能としてのスクリーンショットについて概説
・ペイントソフトの簡単な使い方(トリミング)
・Office2010上での画像加工などを試す。背景の削除、トリミングなど
・Word上での画像の扱いについて概説。
・次回もこの課題の続きを行う。


第3回 10月11日(火)4限
・Y君1名のみ出席。受講生の50%が欠席だなんて寂しすぎる(笑)
・タブの使い方 総復習/リーダーの使い方/リーダーと下線の違い
・罫線をつかって同等のものを作る/表の中の位置揃え
・ページ罫線を使った外枠の追加
・行頭のタブが勝手にインデントになってしまう件 対処法:何か文字を入れておいてタブでそろえる。次に行頭でその文字をdeleteする。
・途中から段組みを変えるには…? 対処法:セクション区切りを入れる。次にセクションごとに段数を変える。段区切り=段組みの中で強制的に改段位置を変える。
・プリント資料に基づき、PrintScreenの使い方とOffice 2010の新機能としてのスクリーンショットについて概説
・Office2010上での画像加工などを試す。明るさ、コントラスト、色の変更、背景の削除、トリミングなど
・ペイントソフトの簡単な使い方(トリミング)
・Word上での画像の扱い
・次回もこの課題の続きを行う。


第2回 10月4日(火)4限
・受講生は今週から2名になった。1名は先週欠席しているので2名の進度調整に苦労。
・タブの使い方の復習をしてからリーダーの使い方を説明。
・同一の内容を表組みを使って位置をそろえる方法を説明。罫線を削除する場合と上から白線でなぞる場合、薄いオレンジ色などでなぞる場合の違いなど。
・表の挿入方法、行の追加と削除、表中の文字の位置そろえなど。
・段組みとセクション区切り、段区切りの使い方を実習。
・次回は図の貼り付け、ページ罫線、スマートアート、Excelグラフの貼り付け、簡単なフォトレタッチと人物が映った写真から背景を取り除く方法、スクリーンショットを入れる方法などから様子を見て内容を決める予定。


第1回 9月27日(火)4限
・当日朝の時点ではMoodleの参加者リストでは4名の履修登録があったようだが、1名しか出席していない、ちょっと寂しい状態で今期の授業スタート。
・シラバス http://t.co/S0kUYlQV の内容をざっと紹介。
・個人用カルテとして試験用紙に名前だけ書いてもらったものを回収し、課題実施状況を後ろで観察しながら気づいたことをメモ。
・本時はWord実習(1)として、タブを使った文書の整形について実習。受講生1名はtabキーの意味をよく理解していなかった様子。左揃え、右揃え、中央揃え、小数点揃えについて説明し、各行に1つずつタブが入る事例と、複数のタブが入る事例について実習。
・タブを行末に入れ、右揃えタブを使って末尾を揃え、行末まで下線を引く実習。
・同一内容を表組みで作る方法については残り時間が少なかったため、実演のみ。次回はこの話から。
・シラバスには本時の内容として段組やページ罫線も扱う旨が書かれているが、時間が足りなかったので次回送り。

省察
・2年次配当科目だが、3年次学生の履修。タブについては2010年度からは1年次配当の情報処理実習(基礎)クラスで使われる教科書には説明が入っているが、それ以前の学生が利用した1年次クラスのテキストではタブとリーダーなどの単元は含まれていない。学年進行で既習・未習の内容が異なる点には配慮が必要。