テキストのないPDFファイルからテキストを抽出するには

 先日公開した記事トレーニングの最適化:安全な筋力トレーニングにおける新しい進展で参照していた引用元の論文からダウンロードできるファイルは PDF であるが,画像として保存されており,テキスト情報が抽出できなかった.以前ならスキャナから OCR ソフトで文字情報を抽出したが,最近だと Google ドキュメントが優秀なので,こちらを使ってテキスト情報を抽出してみた.

“テキストのないPDFファイルからテキストを抽出するには” の続きを読む

市場

 最新の IT 企業内とは思えない.展示会場はさながら市場のようだ.全体が四つの区画に分けられ,中央には広場がある.中央広場から四区画を仕切るように広い通路が伸びており,区画内には細い通路が入り組んでいた.

 周辺の四区画は手前から食品,調理,家電,食器に大別されていた.日本だとこういう会場は仮設のパネルで仕切られているものだが,ここではむしろ本物の市場を模した作りになっている.

 食品区画など,市場そのものだ.布の天蓋,木製の柱と展示台.展示台には色とりどりの野菜や果物が並んでいる.冷蔵ケースには魚介類や肉が見える.

“市場” の続きを読む

スマートキッチン

シアトル

 2020 年 9 月某日,シアトルにある Amazon 本社では静かな期待と興奮が満ちていた.東京オリンピックが終わり,ピークを迎えた日本の株価は徐々に下がりつつつある中,何か重大な発表があるのではないかとの噂で持ちきりだった.

 壇上には Amazon の CEO, ジェフ・ベゾスの姿があった.彼は過去 1 年間の業績を報告した後,新製品について言及した.

「数年に一度,すべてを変えてしまう製品が登場します.それを成し遂げることができれば幸運ですが,我々は何度かの機会に恵まれました」

「2007 年,Kindle を発表,紙の書籍から電子書籍へと移行」

「2011 年,Cloud Player を発表,これは iPhone ほどのインパクトはなかったかも知れない」

 会場に笑いが起きる.

「2014 年,Alexa を発表.タッチ画面から音声へとインターフェースの移行が始まりました」

“スマートキッチン” の続きを読む

Excelのピボットテーブルでクロス集計から統計解析まで

 先日の鬼嫁/神嫁 婚前判定用アンケートを実施しますから鬼嫁/神嫁 婚前判定用アンケート結果に至るまでの解析の過程が誰かの役に立つだろうと考えて投稿する次第.ガチの統計手法だから一般社会人はとりあえずこれマスターしとけ.あ,大学で専門的にやってる人は除外ね.多変量解析とかはここでは扱わない.

 大まかな流れとしては次のような感じ.今回の投稿はできれば Excel のインストールしてある PC で見てくれ.スマホだと演習問題が解けない.

“Excelのピボットテーブルでクロス集計から統計解析まで” の続きを読む

Googleスプレッドシートのフォームでアンケートを作ってみた

 最近,Twitter でフォローしているスーパーサイヤさん (@ri_supersaiyan) に協力してアンケートを実施した.結果や考察についてはスーパーサイヤさんのブログなりツイートで公開されると思う.今回はスプレッドシートからのフォーム作成の経緯を記す.

“Googleスプレッドシートのフォームでアンケートを作ってみた” の続きを読む

英語の論文の翻訳

 実を言うと,英語はあまり詳しくない.学術論文を一本読むのに数日かかる.読み慣れてくる頃には疲れてしまってやる気が失せている.

 読み慣れる,と書いた.読み進めて行くうちに,脳が英語のまま理解し始める瞬間がある.英語で読み,英語で思考し,英語でアウトプットする.これを勝手に「英語モード」と呼ぶことにする.なんというか,脳の中に新しいモジュールが一個できる感じ.

 脳が英語モードに入ってしまえばこっちのものだ.普段考えてる時は,頭の中では日本語で喋ってるだろう?その思考自体が英語になる.俺の脳が英語で喋ってる,俺スゲー!となる.しかしそこまで行くにはかなり集中力がいる.その前段階の話である.

“英語の論文の翻訳” の続きを読む