ひとりごと

[ home ]

気が向いたら書く日記

2025/12/9

New Rules for AI Artists: Creativity Support Tools in the GenAI Era. Interactions の記事。アーティストはもう普通にGenAIを使っている。誰でも早く作れるようになった結果、競争が激化している。大事なのはオリジナリティ。ツールの役割は、1) referenceや suggestionによって探索を支援する 2) 生成結果を自由に調整したり修正できるようにする、3) アーティスト間の情報交換やコラボレーションをサポートする。"True creativity remins a human pursuit.".

2025/11/16

招待講演に呼ばれてインドネシアのバリに行ってきました。興味深かった点。日本の大学に留学したり、日本に出稼ぎにいく人がたくさんいる。オーストラリアからの観光客がたくさんいて、そのあたりだけ物価が高い（ニセコに似ている）。「心の友」という日本の歌がインドネシアで「第二の国歌」と呼ばれるほどの大人気。ドラゴンボールの天下一武道会の舞台のモデルになった寺院がある。トイレットペーパーをトイレに流してはいけない。サルが観光客の眼鏡を盗んでバナナを要求する(!)。移動はスクーターがメインで、タクシーもスクーターに２人乗り。日本車がたくさん走っている。慣れない水と香辛料で旅行者はよくお腹を壊す（バリ腹）。

2025/10/29

UIST visions で "Easy and Fast? Rethinking the Future of Creativity Support Tools"という講演をしました。ここに資料を置きました。2年まえの vision talk を聞いてから考え始めたので、2年越しのプロジェクトでした。かなり競争率が高かったようなので、採択されてよかったです。このために英語の先生を雇って文章を直してもらい、発表練習しました。最初で最後(?)の「デモなし」「ビジュアルなし」の講演でした。学会1日目に講演したのですが、2日目、3日目の論文の発表で、リファーしてくれている方が何人かいてうれしかったです。

2025/10/17

Iryna Gurevych氏による講演。一番印象に残っているのは、質疑での「現在、CS分野で（査読しきれないほど）大量に論文が投稿されているが、それは学生がよりよい企業に就職するための実績に使われているからである。」という発言。なんとくは思っていたが、はっきり言語化されて問題が明確になった。理想をいえば、研究論文とは、自己の興味を突き詰めて、面白いことが見つかったときに、それを皆にシェアするためのものであり、就職のための順位付けにつかう道具ではないはず。就職のため、という間違った使われ方をされているがために、1)研究に興味がない学生まで無理して論文を投稿してくる,2)誰も読まない、面白くない論文が大量に投稿され、査読システムが崩壊する、3)採択されることを目的にした不正が蔓延し、そのチェックに労力がかかる、という結果になっている。

2025/9/5 FIT2025

情報科学技術フォーラム（FIT2025）で講演してきました。内容詰め込みすぎて質疑の時間が取れなかったのが心残り。他に聞いた内容。

能動学習におけるインスタンスごとの教師レベル最適化。能動学習（アノテーションすべき訓練データの中からアノテーションすべきインスタンスを適切に選択する）において、インスタンスを選ぶだけでなく、フルラベルを付けさせるか、弱ラベルを付けさせるかについても最適化で選ぶ。
巡回対称性を持つグロモフ・ワッサースタイン問題。最適輸送で点群同市のマッチングを取るときに、鏡面対象や回転対象などを利用して効率化する。
視覚言語基盤モデルにおけるモダリティ整合のための事後訓練。 CLIPの潜在空間で、視覚表現と言語表現がずれているのを強制的に近づけると汎化性能が上がる。
インクルーシブな未来社会の実現に向けて(山下直美)。従来のインクルーシブの研究は、マイノリティ本人の支援ばかりだった。しかし、(1)支援ツールを使っても完全に障壁はなくならず、また、それらを使うこと自体も負担になる (2) 周囲の人からマイノリティの苦労が見えなくなる、といった問題がある。本研究では、マイノリティ本人でなく、その周囲の人に働きかけることで、マイノリティをサポートする技術を開発する。
自分の講演への質問。なぜ企業の研究所でなく大学で研究することにしたのですか？企業でやるとその企業で実用化してくれないと世に出ない。大学で論文として出せば、世界中のだれかが興味をもてば使ってもらえる。テーマや共同研究者を自由に選べる。企業にはそれぞれ営利事業があり、それへの貢献が求められる。大学では、純粋にアカデミックな興味に基づいた研究ができる（はず）。学生と一緒に研究できる。

2025/7/29 丹後

京織物の生産地である丹後地方を訪問して、絹織物業について話を伺った。

色のついた西陣織と無色の丹後ちりめんがある。ちりめんは、絹を強く拠って固着成分で固めて織ってから、固着成分を溶かす処理をすることで縮みを発生させ、独特のシボのある生地ができる。海外では、薬品を使って縮みを発生させているが、丹後ちりめんほどの伸縮はできない。経糸の上下を機械で制御するジャガード織機で織る。昔はパンチカードだったが、40年くらい前から機械制御になった。 photoshopで作ったビットマップをCGSという京都市が作ったソフトでデータに変換してUSBメモリにいれて織機に読み込ませる。欧米型の大型のジャガード織機と違って、幅36cm着物の反物に特化した小型の織機になっている。経糸3600本に対して解像度が900しかない。また、最近主流のリピア式でなくシャトル式になっている。
典型的な家庭内手工業で、普通の民家のような建物の中で、家族経営で朝から晩まで織機を動かして生産している。着物離れがすすみ、戦後の最盛期に比べると100分の1の規模になってしまっている。この10年でも半分(1000->500)になった。織機を生産していたメーカーはすでに存在せず、今は40年以上昔の機械を使い続けている。高齢化で廃業するところが多いので、そこから部品を取ってきて凌いでいる。
民谷螺鈿では、古くから西陣織を生産していたが、40年前に、貝殻を薄くしたものを織物に織り込む方法を発明した。着物のほか、高級時計などに使われている。螺鈿織の帯が皇室でも使われている。同じような技法で、皮革を織り込んだ生地なども作って欧米の高級ブランドで販売している。最近は神社のお守りの生産も多い。

2025/5/1 CHI 2025 Yokohama

How Scientists Use Large Language Models to Program. 科学者がLLMのサポートを受けてデータ処理のコードを書くようになっているが、そこにバグがたくさんある　＆　誰もチェックしてない　＆　LLMを過信している、このままだと科学論文の正確性が危うい
Code Shaping: Iterative Code Editing with Free-form AI-Interpreted Sketching. IDEでの編集を手書きスケッチで行えるようにした。
3D Printing Eggshells: Exploring Eco-Socio-Technical Relations through Biomaterial Design 卵の殻で３次元プリンタを作った
AIdeation: Designing a Human-AI Collaborative Ideation System for Concept Designers 画像生成モデルをつかったコンセプトアートの描画支援。探索を支援する。

2024/6/7 Geometric Modeling and Processing 2024, Qingdao

久しぶりにちゃんと学会で講演を聞いた気がするのでメモを取っておこうと思います。アルゴリズムの話が難しい…。

Denis Zorin: Metric Optimization in Penner Coordinates. クアッドメッシュを作成するために、局所的サーフェスパッチを平面に展開するプロセスがある。その際、辺の長さが負にならないという制約付きの最適化計算が必要だが、制約付きは解きにくい。本研究では、負の長さの辺を許して最適化しておいて、あとから辺のスワップで正しい平面メッシュにする手法を開発した。
Kai Hormann: Compressing geodesic information for fast point-to-point geodesic distance queries. サーフェス上の測地距離を事前計算によって高速に計算する手法を開発した。事前計算で木構造をつくっておき、計算時には木をたどって値を計算する。サーフェスを半分に割る作業を繰り返して木構造を作る。2点間の測地距離は、各点からサーフェスの境界上の点までの測地距離の合計の最小値として得られる。
Niloy Mitra: Reusin Foundational Models for Geometry Processing. 拡散モデルで3次元的な画像編集する方法として、箱を置いてそれを深度画像にして与える方法と、深度画像に対して3次元的な移動回転をする方法を開発した。あとは、3次元形状の間の対応を取るのに、拡散モデルの内部表現を各点の特徴ベクトルとして利用した。
Leif Kobbelt: Inter-Surface Maps. ２つの3次元サーフェスの間の対応を取るアルゴリズムとして End-to-End の対応を最適化する方法を開発した。まず、いろいろなトポロジーが考えられるので、それを列挙して一番よいものを選ぶ離散最適化を行う。次に、自動微分を利用して局所的な最適化を行う。難しくて成果がでるまで3年くらいかかったらしい。
Kai (Kevin) Xu Learning Fast and Robust Registration for 3D Vision. スキャンで得られた3次元点群の間の対応関係を深層学習を使って計算する手法をいろいろと開発した。古典的な方法は、少数の特徴点のペアを最初に見つける方法だが、よりよい方法として、サーフェスをパッチに分けて、全パッチ間の対応を計算してもっともよいものを探す方法をとる。マッチングの計算においては、回転しても不変な特徴量を設計した。
Takeo Igarashi: Dressing (Digital) Human. これまでの研究の中で、特に布や衣服に関するプロジェクトをいくつか紹介した。Plushie, Sensitive Couture, Clothing Manipulation, Layer Operations, DressUp, PerfectFit, Virtual Try-on, Inkjet4D.

2021/5/8 CHI 2021 Technical Program co-Chairs

せっかくなので忘れないうちにメモを残しておこうと思います。同じような仕事を引き受ける方の参考になれば。

TPC の仕事は、CHI全体の学術的内容の取りまとめです（General chairs が会場や予算の管理)。実情としては、トップではなく完全に中間管理職という感じです。階層を上から見ると, ACM - SIGCHI Executive Committe - CHI Steering Committee - Genral Chairs - TPC となっていて下からみると Reviewers - Associate Chairs - Subcommittee Chairs - Papers Chairs - TPC となっていてちょうど真ん中です。TPCとして decision making することは実はあまりなくて、上で決まったことを下に伝えたり、下からの意見を上にあげたりという交通整理の部分が大きいです。今年の例では、新しい出版プロセス(TAPS)の導入は、著者側からは反対意見が多かったのですが、上で決まったことという形でTPCからできることは残念ながらあまりありませんでした。 TPCの提案で決めたこととしては、1日3スロット用意してそのうち2回発表するという形式があります。賛否両論あるかとは思いますが、何もしないとどうしても欧米中心の時間帯になるので、アジアでもまともな時間に発表・聴講できるようにしたかったので実現できてよかったです。

具体的な仕事は、初期では各プログラムのチェアの任命と、後期ではセッションの割り当て作業になります。チェアの任命では、とにかく「ちゃんと仕事してくれる人」を選ぶために、ツテを使って確認をとることが大事になります。前任者からは「仕事しないチェアがいたら辞めさせることも重要」といわれていましたが、幸いそこまでの事態はありませんでした。ただ、皆さん本務があって忙しいので、指示してもなかなか反応が返ってこないことがしょっちゅうで、その点はストレスでした（リマインダを送り続けたり、最悪の場合の準備をしたりなど）。

採択がすべて決まった後はセッション割り当て作業です。同じ著者が同じ時間帯に２つのセッションに割り当てられないようにしなくてはいけないのですが、テーマを合わせるといった制約が多くなかなか大変です。ただ、初期の割り当てはまだよくて、一番時間を取られるのが、事後の変更 (exception handling) になります。割り当てが終わってプログラムが完成したあとに、細かい変更が五月雨式に大量にやってきます。その都度、こまごまとした作業が数多く発生します。一番大変なのは data chairs だったと思いますが、とにかく数が多いので、物理的に疲弊しました。

やってみてよかったこととしては、大きい組織の運営の様子を垣間見ることができた点かと思います。特に、非常に優秀な方々と一緒に仕事をさせていただいたのは他では得られない経験でした。得られた教訓としては、重要な判断が必要なのに返事がない、ということが頻繁に起きるので、かならず締め切りを設定して、返事がなかった場合にどうするかをあらかじめ決めて伝えておくべき、というのがあります。著者へ連絡をするときも、1,000通の指示を同時に送るので、その中の一定の割合でincident が起きることを織り込んで計画を立てる必要がありました。

最後に、TPCの仕事をしていく上ではいろいろな方に助けていただきました。数が多いので、ここで個別に名前をあげることは避けますが、運営者・著者・参加者等、サポートいただいた方々に感謝の意を表したいと思います。

2020/10/4 InkLecture

講義の板書に使っているソフトウェア(InkLecture)を公開してみました。Windows 10 + Tablet PC (Display Tablet) 用。よろしければ使ってみてください。ずっと教室でプロジェクタ用に使ってましたが、オンライン講義にも最適と思います。

2019/8/2 SIGGRAPH 2019

Learning to Fly: Computational Controller Design for Hybrid UAVs With Reinforcement Learning ドローンコントローラの自動設計。物理シミュレーションを利用して、ジョイスティックで指示された動作を実現するようなモーター出力を自動学習する。シミュレータ世界と物理世界のずれを補正するために、訓練時に「期待している結果と現状の違い(の積分)」を計測しつつそれが減るように強化学習する。
Designing Chain Reaction Contraptions From Causal Graphs ピタゴラスイッチの最適化。実物を作るときにどうしても誤差が生じるので、誤差が起きてもロバストに動くように最適化を行う。「サンプリングしてシミュレーションして評価する」を繰り返すときに、ベイズ最適化によって効率的に学習できるサンプルを選択する。
VR Facial Animation via Multiview Image Translation facebookの論文。HMD に仕込まれた３カメラで撮影した画像をもとに、顔画像をCNNで合成する。訓練時には、６カメラで撮影した画像を使う。また、cycleGANで合成した画像を使って学習を行う。
Deep View Synthesis from Sparse Photometric Images 6枚の写真から中間の画像をCNNで生成する。各深度ごとにどの画像を参照するべきかを決定するattention map と、各頂点事の深度を示す depth map を利用する。
Deep Reflectance Fields - High-Quality Facial Reflectance Field Inference from Color Gradient Illumination ライトステージでいろいろな方向からの光を撮影するのは時間がかかるので、色が徐々に変わる gradient illumination で撮影した画像から relighting できるようにする。CNNを使う。
Single Image Portrait Relighting 1枚の顔写真をもとにrelighting を行う。そのために、ライトステージで撮影した顔をいろいろな環境光で relighting した画像で学習した結果を使う。ネットワークは、入力した光の方向を返し、指定された光の方向にあう画像を出力する。
The Vector Heat Method 3Dサーフェス上でベクタを補間してベクターフィールドを構成するアルゴリズム。ベクトルのdiffuse と magnitudeのdiffuse とindicator のdiffuse を組み合わせる。最初に線型方程式を解くだけでよい。
SurfaceBrush: From Virtual Reality Drawings to Manifold Surfaces 3次元空間中に直接描かれたブラシストロークを融合してサーフェスを生成する。
Vidgets: Modular Mechanical Widgets for Mobile Devices ハードウェアのボタンやホイールをスマホにつけて加速度センサーで認識する。ボタンの内部の形を変えると信号も変わるので区別できる。

2018/12/7 SIGGRAPH ASIA 2018

Paparazzi: Surface Editing by way of Multi-View Image Processing スーパーピクセルやスタイルトランファーなどの画像処理フィルタを3次元メッシュに適用する。ディフェレンシャルレンダリングを利用している。
InverseCAD: Automatic Conversion of 3D Models to CSG Trees スキャンして得た点群からプログラム合成でCADモデルを生成する
3D Hair Synthesis Using Volumetric Variational Autoencoders 写真を入力して3次元ボリュームの髪の毛を得るCNN。
Learning to Dress: Synthesizing Human Dressing Motion via Deep Reinforcement Learning 強化学習で、キャラクタが自分で服を着る。
Robust Flow-Guided Neural Prediction for Sketch-Based Freeform Surface Modeling 手書きスケッチで3次元モデリングする。CNNを使う。
Learning a Shared Shape Space for Multimodal Garment Design 手書きスケッチで服をデザインする。服の種類は決まっていて、型紙のパラメータを推測する。
Interactive Design of Periodic Yarn-Level Cloth Patterns 繰り返しのある編み物のパターンの物理シミュレーション

2018/11/7 UIST 2018

The Science and Practice of Transitions 隙間時間に仕事できるように、タスク(文章校正など)を自動的に細切れにしてスマホに送る。細切れにすると、まとめてやるより遅くなるが、外乱からの影響が減る。
MetaArms: Body Remapping Using Feet-Controlled Artificial Arms 体に付けたロボットアームを足で操作する
Dynablock: Dynamic 3D Printing for Instant and Reconstructable Shape Formation レゴのような3次元ブロックを自由な形につなげて出力する
TrussFormer: 3D Printing Large Kinetic Structures PETボトルをつなげて作った構造物を空圧アクチュエータで動かす。
Wireless Analytics for 3D Printed Objects バックスキャッタリングでバッテリーなしで動作するIoT機器にメモリを加えた。
Vibrosight: Long-Range Vibrometry for Smart Environment Sensing 部屋の中の機器に付箋をつけて、その振動をレーザースキャンで見る。
SilentVoice: Unnoticeable Voice Input by Ingressive Speech 息を吸いながらしゃべる。
Extending a Reactive Expression Language with Data Update Actions for End-User Application Authoring データベースにアクセスするようなWebアプリをマークアップだけで書けるようにする。コマンドの置かれた場所のスコープによって動作が変わる。
Non-Linear Editing of Text-Based Screencasts コーディング（テキストタイプ）の様子を録画した動画を、依存関係を考慮して編集できるようにする。
I/O Braid: Scalable Touch-Sensitive Lighted Cords Using Spiraling, Repeating Sensing Textiles and Fiber Optics 組み紐にセンサやライトを編み込む
Increasing Walking in VR using Redirected Teleportation VRでの移動で、ジャンプのかわりに、「ポータルに入る」動作を使う

2018/11/7 CHI 2018

Agile 3D Sketching with Air Scaffolding ３Dスケッチングで、空中の手の動きを記録してガイドにする。
RFIBricks: Interactive Building Blocks Based on RFID ブロックの接続状態をRFID をつかってバッテリーレスで認識する。
Improving Comprehension of Measurements Using Concrete Re-expression Strategies 文章に出てくる数量が直感的に把握できるように、身近なものに置き換えて提示する。
A Visual Interaction Framework for Dimensionality Reduction Based Data Exploration 次元削減の意味を理解できるように、インタラクティブに探索できるようにした
Metamaterial Textures 3Dプリンタで動的に変化するテクスチャをプリントする。
Uncertainty Visualization Influences how Humans Aggregate Discrepant Information データの不確実性を可視化する。
Forte: User-Driven Generative Design トポロジー最適化による構造生成にインタラクションを入れる
HARK No More: On the Preregistration of CHI Experiments 実験が終わった後に仮説を作る（HARK)を防止するために、実験前に仮説を公開する。
Value-Suppressing Uncertainty Palettes 不確かさを色で可視化する
Data Illustrator: Augmenting Vector Design Tools with Lazy Data Binding for Expressive Visualization Authoring
DataInk: Direct and Creative Data-Oriented Drawing
InfoNice: Easy Creation of Information Graphics
データのグラフ表示をドローエディタを通して編集する
RoMA: Interactive Fabrication with Augmented Reality and a Robotic 3D Printer ロボットアームにつけた３Dプリンタヘッドとインタラクションする
Using Animation to Alleviate Overdraw in Multiclass Scatterplot Matrices 他クラスサンプルの散布図をアニメーションで見やすくする

2018/3/8 IUI 2018

AnchorViz: Facilitating Classifier Error Discovery through Interactive Semantic Data Exploration 機械学習でデータを分類するときに、データの様子をどのようなカテゴリを作ればよいのかを検討するプロセスを支援する。データを円の中に2次元レイアウトして、円周上にアンカーを配置することで探索を支援する。例としてウェブページに分類を扱っている。
Closing the Loop: User-Centered Design and Evaluation of a Human-in-the-Loop Topic Modeling System トピックモデリングによる文書の分類で、自動で計算されたトピックをユーザが修正できるようにした。キーワードの追加・削除、文書の追加・削除、トピックの削除・分割・統合などをサポートしている。
User Modelling for Avoiding Overfitting in Interactive Knowledge Elicitation for Prediction ユーザがアノテーションするときに、提示される情報によってバイアスがかかるので、そのバイアスの考慮して学習を行う。例として、amazon のレビュー文からスコアを推測するモデルを学習させるために、ユーザが各キーワードの関連度をスライダーで入力する。

2017/12/3 SIGGRAPH ASIA 2017

Bringing Portraits to Life 顔の写真を自動でアニメーションさせる。別の顔の動画から特徴点の動きを取り出してそれをもとに2次元モーフィングする。歯や眉間の皺などは別途付加する。
Autocuts: Simultaneous Distortion and Cut Optimization for UV Mapping UVマップを計算するときに、どこをどう切るかも一緒に計算する。ばらばらの三角形を徐々にくっつけていく。
Seamless: Seam Erasure and Seam-aware Decoupling of Shape from Mesh Resolution テクスチャの切れ目を目立たなくするようにテクスチャ画像を調整する。UVマップはそのまま。
Computational Design and Fabrication of Soft Pneumatic Objects with Desired Deformations 空気を入れて膨らませたときに、指定した形になるように、素材の分布を最適化する。膨らむ方向やねじれなどを制御できる。
Scattering-aware Texture Reproduction for 3D Printing 3プリンタで2次元の画像をプリントするときに、最上面にそのまま印刷するのでなく、散乱などを考慮して下の層も最適化することで、よりはっきりした画像にする。
3D Printing Wireless Connected Objects ボタンの押し下げや水の流れなどの物理的な動きを機械的にコード化してアンテナをONOFFすることで、バッテリなしでの通信を行う。離れたところにあるWiFi受信機で信号を読む。

2017/10/25 HCOMP 2017　Towards a Universal Knowledge Accerator by Niki Kittur

大勢の人間の知恵をあつめて問題解決を行うシステムを目指している。３つ類型について議論する。まずは wikipedia 。ボランティアで皆で辞書を作る。wikipedia の編集プロセスを分析して、文書の質が執筆者の数でなくコミュニケー所の例に依存することを示した(CSCW2008)。文書のラベル付けをするときに一部しか見ないと偏るので、まず全体からランダムに抽出した文書をたくさんみてから作業させることで質の向上を実現した(CHI2016)。次はcrowdsourcing 。お金を払って仕事をしてもらう。トマトの育て方や自動車の修理方法などをクラウドワーカーに調べさせて文書にまとめてもらうシステムを作った(CHI2016)。最後はウェブブラウジング。普段の作業から抽出する。スマホでテキストの一部を選ぶのが大変なのでわざと漠然としか選べないようにした(UIST2016)。ブラウザのタブの管理をサポートする機能を付けた(submitted)。将来的には視線や生体情報などを活用したり、3Dプリントやコーディングなどにも応用したり、パーソナライゼーションなどもやっていきたい。

人工知能との関係について。人工知能はwell-definedな処理には適しているが、open 問題については人間のほうが適している。人間の脳はもともと多数のモジュールによる分散処理である。将来は、多数の人間知能と機械知能が協力して問題解決をするようになる。

2017/10/25 UIST 2017 in Quebec

Learning Visual Importance for Graphic Designs and Data Visualizations 人間がグラフィックデザインのどこに注目するかをクラウドソースで集めて学習して予測する。クラウドの視線はとれないので、マウス操作で代替させる。
Reinventing the Wheel: Transforming Steering Wheel Systems for Autonomous Vehicles 半自動運転車のハンドルを、自動運転時にはしまわれていて、手動運転必要時には出てくるようにする。
Outside-In: Visualizing Out-of-Sight Regions-of-Interest in a 360 Video Using Spatial Picture-in-Picture Previews HMDで、視野の外にある注目点を picture-in-picture で提示する。
CircuitSense: Automatic Sensing of Physical Circuits and Generation of Virtual Circuits to Support Software Tools ブレッドボードに抵抗とかLEDを指すと、場所と種類を認識して、対応する仮想ブレッドボードを自動作成する。
CurrentViz: Sensing and Visualizing Electric Current of Breadboarded Circuits ブレッドボード上の回路の各部の電圧と電流を自動的に計測して可視化する。
SweepCanvas: Sketch-based 3D Prototyping on an RGB-D Image デプスイメージの上で、平面を認識して、それを手がかかりにスケッチモデリングを行う。
DreamSketch: Early Stage 3D Design Explorations with Sketching and Generative Design スケッチでプロダクトデザインするシステムに、トポロジー最適化を組み込んだ。
Interactive Room Capture on 3D-Aware Mobile Devices デプスイメージで撮ったポイントクラウドの中の椅子やテーブルをデータベースから認識して配置する。
SceneCtrl: Mixed Reality Enhancement via Efficient Scene Editing デプスイメージで撮ったポイントクラウドの中の椅子やテーブルを削除したり動かしたりできるようにする。
AirCode: Unobtrusive Physical Tags for Digital Fabrication 3次元プリントするときに目に見えないような小さい空洞を入れておき、それをコンピューテーショナルカメラでコードとして認識する。

2017/9/28 研究員募集

我々の JST CREST で、研究員や学生アルバイトを募集しています。詳しくはここを参照ください。興味のある方は、ぜひ一度お問い合わせください。

2017/3/12 SIGGRAPH ASIA 2016

Dynamic Furniture Modeling Through Assembly Instructions 家具の組み立て説明図から自動的に3次元モデルとアニメーションを生成する。
Computational Bounce Flash for Indoor Portraits カメラで写真を撮るときに、自動的に最適な間接照明になるように方向にフラッシュを向ける。
A Scalable Active Framework for Region Annotation in 3D Shape Collections Author Preprint ３次元モデルへの領域アノテーションの支援。active learning. 自動推定の結果を評価するステップを入れる。
Pyramid of Arclength Descriptor for Generating Collage of Shapes コラージュをつくるための手法。部分形状特徴量を高速に計算してマッチングする。
High-Fidelity Facial and Speech Animation for VR HMDs HMD装着時のための顔の表情キャプチャ。目と口の映像から機械学習で表情を合成。
Printone: Interactive Resonance Simulation for Free-form Print-wind Instrument Design ３次元モデルでオカリナを作る。音程がでるように穴を最適化。
FlexMolds: Automatic Design of Flexible Shells for Molding シリコンで作った柔らかい型で鋳造する。
FrameFab: Robotic Fabrication of Frame Shapes ３次元プリンタでワイヤーモデルを作るためのツールパスを計算する。常に（サポートなしで）安定している＆ぶつからない。
Fabrication of freeform objects by principal strips 平面シートを縦横に編んで立体自由形状を表現する。
３次元プリントで、頭や手足を付け替えできるようなおもちゃを作る。セグメンテーションとコネクタ部分の最適化。
Gesture3D: Posing 3D Characters via Gesture Drawings 輪郭の線画と３次元モデルを与えると、輪郭が合うようにモデルをポージングする。
Directing User Attention via Visual Flow on Web Designs Paper Abstract Author Preprint Paper Video Paper Data ウェブページ上での項目間の視線の動きをモデル化し、望みの視線移動になるように最適化する。
An Intuitive Control Space for Material Appearance BRDF を直観的に編集できるようにする。PCA->crowd->再mapping

2016/8/4 Open Campus

大学のオープンキャンパスで講演したら高校生からいろいろ質問されたので、回答をここに書いておきます(あくまで私見です)。

Q: 今から何を勉強しておけばよいですか？
A: まずは、数学や物理など基礎的な科目をしっかり勉強すること。英語も大事。読むのも書くのもすべて英語なので。プログラミングは大学に入ってからでもよい。興味があれば、自分で勉強していろいろ作ってみるのもよいが、必須ではない。
Q: 海外に留学できますか？
A: 大学院生でスキルがあれば、インターンや客員研究員など、向こうにお金を出して海外にいくことができる。そのためには、「ポートフォリオ」を積み上げることが重要。普段から、プログラムでも論文でも課題の成果でも何でもよいので、「人に見せられる成果」をためていく。
Q: 一番大変なところ、苦労する部分はどこですか？
A: 何をやるのかを決めるところ。普通に思いつくものは、世界中を見ると誰かがやっている。たくさん考えて、なんども失敗（＝先行研究の発見）しながら、やっとのことで探し当てる。ぼやっとしたアイデアを研究テーマとして具体的な形にするのも非常に難しい。何年もかかることがある。
Q: 今日の講演で聞いたようなトピックの最新情報はどうやって見つければよいか？
A: プロは学会で発表された論文を読む。SIGGRAPH,UIST,CHIなど。慣れないうちは、グラフィクス、ユーザインタフェース、ヒューマンインタフェース、バーチャルリアリティ、拡張現実感、メディアなどといったキーワードを掲げている大学の研究室のホームページなどを見るとよい。「情報」と名のつく学科があれば１人ぐらいはそういう先生がいるはず。
Q: 世の中のUI (windows など) はなぜあんなに使いにくいのか？
A: 出来上がったものをみてダメというのは簡単だが、万人を満足させるUIをデザインするのは非常に難しく、コストがかかる。映画やゲームをみて批評するのは簡単だが作るのは難しいのと同じ。また、作る側は「あなた」だけのためにデザインしているのでなく、世界中の多様なバックグランドのユーザ向けに一般的なものにせざるをえず、特定の個人にとっては中途半端になりがち。

2016/7/30 SIGGRAPH 2016

Erosion Thickness on Medial Axes of 3D Shapes medial axes の点の重要度として、その点での半径と、その点から表面までの実際の距離の差を使う。
Animated Mesh Approximation With Sphere-Meshes アニメーションするメッシュを入力として、それを Sphere-meshに変換する。sphere の数と大きさは固定。
Interactive Sketching of Urban Procedural Models いろいろなパラメータで３次元の建物モデルををつくって手書き風にレンダリングして、その関係を機械学習にかける。学習したモデルに、手書きの建物を入れると、建物の３次元モデルが得られる。
Computational Thermoforming テクスチャをプリントしたプラスチックのフィルムを温めて型の上において吸引する成型方法で、テキスチャの変形を予測する。
Procedural Voronoi Foams for Additive Manufacturing 空間的に物性（ヤング率）の変わる物体を3Dプリントする。ボロノイボリュームのエッジを使う。
Pushing the Limits of 3D Color Printing: Error Diffusion With Translucent Materials フルカラー3Dプリンタで、表面だけに色をつけるのでなく、内部にもハーフトーンで色を付けることでコントラストを上げる。
Globally Optimal Toon Tracking カートゥーンの塗領域のフレーム間対応を自動的に取り出す。既存研究のように隣り合うフレーム間で色と形だけをみるのでなく、複数フレーム間で動きを考慮した最適化を行う。
StyLit: Illumination-Guided Example-Based Stylization of 3D Renderings アーティストの手書きの絵のスタイルを3DCGに移す。Image Analogy を使うが、パッチを探すのに、色や法線だけでなく、ディフューズやスペキュラー成分の対応も考慮する。
Transfiguring Portraits 顔写真とクエリを入れると、検索結果の画像の中から入力顔写真にうまくマッチする画像を探してきて、顔ハメする。髪型変えたり、70年代風にしたりできる。dreambit.xyz

2016/2/15 Tangible and Embedded Interaction

MobiSweep: Exploring Spatial Design Ideation Using a Smartphone as a Hand-held Reference Plane スマホを使って３次元モデリングする。輪郭をタッチスクリーンに書いてから上下に動かしてextrusionする。
TMotion: Embedded 3D Mobile Input using Magnetic Sensing Technique ペン先に磁石をつけてスマホの磁気センサで３次元トラッキングする。ペンに方向センサをつけている。
DataSpoon: Overcoming Design Challenges in Tangible and Embedded Assistive Technologies スプーンをうまく使えない人を支援するためにスプーンにジャイロセンサーを埋め込んだ
T4Tags 2.0: A Tangible System for Supporting Users' Needs in the Domestic Environment 家の中でセンサーとデバイスをつないだ動作をプログラミングする。

2014/8/22 What is Unique to Human? by Tetsuro Matsuzawa

CABS 2014 招待講演。チンパンジーの研究を通じて、人間の本質とは何かを明らかにする話。まずは新しい研究手法の話。自然環境内に実験環境を設置して実験したり、実験環境内でなるべく自然な状況を作り出して観察する。人間らしさ１：生まれてすぐに親から離れて寝ている。だから泣いたり、表情でコミュニケーションしたりする。手も使いだす。チンパンジーはずっと親にくっついている。人間らしさ２：文字が扱える。チンパンジーでも単純な対応づけはできる。数を数える。数字を順にタッチする。画面から消えた数字を記憶する(人間より優れた短期記憶を持つ)。色と漢字の対応を覚える、などができる。ただ、抽象化はできない。人間らしさ３：チンパンジーにも親から子へ伝承される「文化」がある（木の実を石で割るのは特定の群れ内のみ）。チンパンジーの教育は「徒弟制度」。やって見せるだけで教えない。人間らしさ４：想像力がある。目鼻口の無い顔の輪郭を描いた紙を渡すと、チンパンジーは輪郭の上をなぞるだけ。３歳以上の人間は、目鼻口を描く。チンパンジーは"here & now"の世界を生きている。そこに「ある」ものだけを見る。人間は、今そこに「ない」もの、未来や過去、遠くの場所での出来事を想像することができる。

2014/8/13 SIGGRAPH 2014

AverageExplorer: Interactive Exploration and Alignment of Visual Data Collections 大量の画像の中から目的のものを探す。すべての平均を表示する。

Inverse-Foley Animation: Synchronizing rigid-body motions to sound 音響信号を入れると、それにぴったりあうような物理的なシミュレーションを生成する。

Flower Modeling via X-ray Computed Tomography 花のＣＴスキャンからサーフェスモデルを作る。

Displaced Dynamic Expression Regression for Real-time Facial Tracking and Animation カメラによる顔のリアルタイムトラッキング。あらかじめ大量の映像で学習しておいたものを利用して特徴点を認識する。また、トラッキング中に、顔の３次元モデルテンプレートもアップデートしていく。

Authoring and Animating Painterly Characters ３次元モデルの周囲に３次元ブラシストロークを置いていく。OverCoatのアニメーション版。ストロークの補完アルゴリズムに工夫がある。スムーズだけど、オーバーシュートしない。

Ink-and-Ray: Bas-Relief Meshes for Adding Global Illumination Effects to Hand-Drawn Characters ２次元の絵に陰影をつけるためにふくらます。従来手法は法線のみだが、ここでは３次元メッシュを作る。

Design and Fabrication by Example 実世界で組み立て可能な家具などをデザインするエディタ。あらかじめエキスパートの作った家具モデルをたくさん用意しておいて、それを組み合わせたり調整したりしてモデリングする。

Designing Inflatable Structures ３次元モデルをもとに、空気を膨らませてつくるバルーンをデザインする。つなぎ目はユーザが描き、システムがパッチの形状をシミュレーションを使って最適化する。

Pteromys: Interactive Design and Optimization of Free-formed Free-flight Model Airplanes よく飛ぶ紙飛行機をデザインする。紙飛行機をたくさん飛ばして計測したデータをもとに予測モデルを作る。

Computational Design of Linkage-Based Characters ボーンでできたアニメーションから、リンク機構で動くモデルを作成する。werner gergaut

Boxelization: Folding 3D Objects Into Boxes トランスフォーマーのように、ある形からある形へ変形するパズルを計算する。形は木探索を使う。パスはunfoldを使って計算する。

Self-Refining Games using Player Analytics 時間のかかる流体シミュレーションとレンダリングをオフラインで行っておいて、それをつなげてリアルタイムな操作に対応して表示する。オフライン計算する際にどの操作を計算しておくかを決めるのに、

Edit Propagation using Geometric Relationship Functions 新しく置かれたオブジェクトの周りの位置関係を調べて、同じような位置関係にある場所に同じオブジェクトを複製する。各位置関係ごとにレベルセットを計算して合算する。

Spin-It: Optimizing Moment of Inertia for Spinnable Objects ３次元モデルをくるくる回るコマにする。

PushPull++ PushPullの拡張。接する面がななめの場合にも適切に処理する。

Flow complex based shape reconstruction from 3D curves 3次元の曲線で表現されたモデルに面を自動的にはる。

True2Form: 3D Curve Networks from 2D Sketches via Selective Regularization 曲線を含む２次元の線画を３次元化する。どの制約を使うかを決めるときに、「適用してみてだめならやめる」という方法を取る。

Exploratory Font Selection Using Crowdsourced Attributes クラウドソーシングでデータを集めて、形容詞を使ってフォントを選べるようにする。

12/12/21 さきがけ研究成果報告会

学習進化機構に基づくスパイラルケアサポートシステム　高玉圭樹
- 高齢者の介護を情報技術によって改善する。まず、ベッドに組み込んだ呼吸計測システムによって非介護者の睡眠の深さの計測行う。その後、介護プラン（リハビリ、入浴）などと睡眠の深さの関係をデータマイニングして、睡眠が深くなるようなプランを生成する。実際に自明でないルールを発見することに成功している（リハビリしてなければ入浴しなくても良く眠れるが、リハビリした場合には入浴しないとよく眠れない）。
集団としての人間の行動軌跡解析と場のデザイン　和泉潔
- 手術室のレイアウトを変えたときに、人の動きがどうなるかをシミュレーションで予測する。普通は、平均値などを計算するが、事故を減らすことが重要なので、たくさんシミュレーションした中で最悪の場合を取り出して提示する
- 株式市場における取引をシミュレーションで解析することによって、取引所の設定するルールの最適なパラメータを模索する。
世界の子供達をつなぐ遠隔操作ロボットシステム　田中文英
- すでに教育用テレビ会議システムなどは存在しているが、音声・映像のみだと、子供はディスプレイの前で固まってしまうという問題がある。そこで、遠隔操作ロボットを導入して身体的なインタラクションを可能にすると、固まらずに交流することができるようになる。
- 教育用ロボットというと普通はロボットが先生役になってロボットが子供に教えるものが多い。逆転の発想で、だめなロボットを用意して、子供がロボットに教えるようにすることで、子供の学習が進むことを確認した。

12/12/20 ACM UIST

UIST2013のプログラムチェアをやることになって投稿規定を見直していて初めて気づいたのですが, SIGCHIでは、英語以外の言語で出版済みの論文でも投稿を受け付けているのですね。ここに明記してあります。こうなったのはいつからなのでしょうか？いずれにしても、日本語で既発表の論文でも国際会議で発表できるということで我々としてはメリットだと思います。皆さん、ぜひ日本語で発表済みでもよいので面白い研究成果があればぜひ UIST への投稿をお願いします。以下、当該部分の引用です。"Work that has previously been presented or published in a language other than English may be translated and presented or published in English in SIGCHI journals and conferences insofar as ACM SIGCHI is concerned. "

12/12/17 ERATO 成果報告シンポジウム

私が研究総括をしているJST ERATO 五十嵐デザインインタフェースプロジェクトの成果報告シンポジウムを 12月19日に、東大の伊藤国際学術研究センターで行う予定です (詳細はこちら)。我々の５年間のプロジェクトの研究成果を紹介するとともに、ゲスト(中村勇吾氏, 竹中司氏, 小林茂氏)を招いてのディスカッションも予定しております。参加費および参加登録ともに不要ですので、ぜひ興味のある方はご参加ください。

12/10/14 UIST 2012

UISTは投稿数がどんどん増えていて、このままでは single track, 3days が維持できなくなってきていて、どうするか議論になってます。いまのところアンケート取ると、four days, double track, lower acceptance ratio の順みたいですが、あまり差はなくて、割れているようです。

Real-Time Captioning by Groups of Non-Experts 音声データの書き起こしをクラウドで行う。独立に書き起こした断片を統合する。遺伝子読み取りの統合アルゴリズムを利用。
Low-cost Audience Polling Using Computer Vision 授業中に学生からの返答を集計するために、大きな紙にバーコードを印刷したものを学生に配って、カメラで認識する。
Learning Design Patterns with Bayesian Grammar Induction web page layout の生成規則を複数の例から生成する。もっともバランスのよい生成規則を探索によって生成する。
Adding Structured Data in Unstructured Web Chat Conversation Chat の中にform を埋め込む。
Waken: Reverse Engineering Usage Information and Interface Structure from Software Videos ビデオチュートリアルを画像解析して、コマンドの履歴を抽出する。
Tutorialbased Interfaces for Cloudenabled Applications チュートリアルのように見えるマクロ。入力画像データの変化を追いながらそれぞれのステップでパラメータなどを調整できる。VNCで実装
Clui: A Platform for Handles To Rich Objects アパートの部屋の写真に値段や住所やコンタクトなどの情報を付けておく(webit)。spreadsheet, map, stwitter, gmailなどにDNDできる。(piggybank, yahoo pipes, vegemite, mashmaker) Vapor->Clui (plugins).
DejaVu: Integrated Support for Developing Interactive Camera-Based Programs カメラ使ったプログラム用のIDE拡張。変数をCanvas にDNDすると、内容を確認できる。
Histomages: Fully Synchronized Views for Image Editing 画像をヒストグラムに変換して操作する。色相で選んだり、明るさで選んだりできる。
Sketch-Editing Games: Human-Machine Communication, Game-theory and Applications ユーザがスケッチを描くと、システムが認識して、書き直す。
UnderScore: Musical Underlays for Audio Stories ナレーションの声に自動で盛り上げるようなＢＧＭを付けてくれる。
3D Puppetry: A Kinect-based Interface for 3D Animation 立体的な人形を3次元トラッキングして、アニメーション作成できるようにした。
Designing for Low-Latency Direct-Touch Input ふつうのタッチパッドは100msの遅れがある。1ms の遅れの専用ハードウェアを作ってみた。
FlowBlocks: A Multi-Touch UI for Crowd Interaction 大勢でマルチタッチテーブルを操作しているときに、意図しない動作を防ぎ、合意の必要な動作が勝手に起きないようにするために、タップでなくボタンドラッグを使う。
A Thin Stretchable Interface for Tangential Force Measurement ストッキングとフォトレフレクタを使ったセンサ
Capacitive Fingerprinting: Exploring User Differentiation by Sensing Electrical 人体に電気信号を流すときの周波数特性をはかって、個人識別に使う。
Acoustic Barcodes: Passive, Durable and Inexpensive Notched Identification Tags 木にレーザーカッターでバーコード上の切り込みを入れて、それをなぞったときの音でIDを取る
Printed Optics: 3D Printing of Embedded Optical Elements for Interactive Devices ３次元プリンタで透明な素材をプリントして、光学系を作る。ディスプレイ、センサー、および照明に使える。
Interactive Construction: Interactive Fabrication of Functional Mechanical Devices レーザーカッターの中の木にレーザーポインタで線を引くと、その通りに切ってくれる。

12/2/17 IUI 2012

ポルトガルまで行って講演してきました。学会は、一応、履歴を使った適応・学習・予測の話がメインみたいですが、その他、インタフェース関係であればなんでもありな感じでした。100人ぐらいでこじんまりしてました。

招待講演：Machine lerning for intelligent interfaces, by Chris Bishop (MSR cambridge): 前半はKINECTのスケルトン認識の話。トラッキングをするのでなく、フレーム毎にパターン認識をしているところがポイント。デプスイメージの各ピクセルが体のどの部分に対応するかのラベリングを、モーションキャプチャをつかった大量トレーニングデータから決定木として学習。ラベリングされたピクセルをクラスタリングしてその中心を関節点とした。後半はグラフモデルによる機械学習の話。機械学習にはたくさんアルゴリズムがあってどれを選んでよいかわからない。なので、問題の性質をグラフで表現して、そこから自動的に学習するという統一的なフレームワークを提案している。 infer.net という名前の確率モデルにもとづくプログラミング環境としてすでに公開している。
Style by Demonstration: Teaching Interactive Movement Style to Robots: 例示によって、ユーザの動きに対してどう反応すべきか、をロボットに教える。教えるときには、ルンバを教示者が棒で押して動かす。実行時には、ルンバが自分で動く。ベストペーパー
Studying User-defined iPad Gestures for Interaction in Multi-display Environment: kinect 使って手先でunistroke入力。手術中の文字入力につかう。kinectジェスチャーの話は他にもあった。
Studying User-defined iPad Gestures for Interaction in Multi-display Environment: iPad から、他のiPadやテーブルトップや壁ディスプレイにオブジェクトを移す時のジェスチャーを調べた。すくいあげたり、振り落したり。
Using Intelligent Natural User Interfaces to Support Sales Conversations: 生鮮食料品売り場のカウンターで、品物を指さしして、選ぶ。
A Glove for Tapping and Discrete 1D/2D Input: 手にグローブを付けて、親指で人差し指や中指をこするジェスチャーをする。
Using Overlays to Support Collaborative Interaction with Display Walls : 巨大なディスプレイを複数人で操作するのに、各自のiPadをつかう。個人に対応した作業エリアがオーバーレイで表示される。
On Slide-Based Contextual Cues for Presentation Reuse スライドを作っているときに、ディスクにある自分の過去のスライドの中から自動的に似たものをもってくる。
Effective Browsing and Serendipitous Discovery with an Experience-Infused Browser ウェブページの中で、自分のメイルアーカイブにでてくる名前があったらそれをハイライトする。
Towards an Intelligent Reviewer's Assistant: Recommending Topics to Help Users to Write Better Product Reviews: アマゾンなどでレビューを書くときに、いま書いている内容と既存のレビュー内容をもとにコメントの候補を提示する。
Automatic Reverse Engineering of Interactive Dynamic Web Applications to Support Adaptation across Platforms: java script つきの動的なページの見栄えを変える。デスクトップ向きのページをモバイル向けにする、などが可能になる。
Towards Automatic Functional Test Execution: プログラムの自動テストを行うプログラムを自然言語で記述する。曖昧なところはユーザに確認する。
Lin-spiration: Using a Mixture of Spiral and Linear Layouts to Explore Time Series 時系列データの可視化。注目しているところは真ん中に直線で、それ以外の部分は左右にぐるぐる巻きで表現する。カセットテープみたい。

12/1/19 コンピュータグラフィクスと数学

セミナーにいって話をしてきました。

球面の裏返し　平澤美可三球面の表と裏を、途中で一度もつぶさずにひっくり返す方法の話。論文では、ステップを一つずつ絵で説明するらしい。
カンドル理論入門　井上歩結び目理論の話。結び目の区間に記号を割り当てて、交差をオペレータと考えると、それがカンドルという代数系になる。さらに２次元での結び目の彩色や、３次元での結び目の補空間の４面体分割について考えていく。
ナノ構造が生み出す色　昆虫や鳥の構造色　木下修一構造色には、薄膜干渉（しゃぼんだま、パール、ハト）、多層膜干渉（玉虫、コガネムシ、ネオンテトラ）、回折格子（レインボーアンモナイト）、フォトニック結晶（オパール、クジャク、ツバメ, gyroid）、散乱(カワセミ、イトトンボ)などの種類がある。顕微鏡でみたり、計算してみたり、試作したりする。
デザインのためのインタフェース主にアルゴリズム的な面白さのあるものを中心に紹介した。teddyやfibermesh などは結び目理論などの可視化に使えそう。
コンピュータ支援による曲面結び目理論４次元空間における２次元曲面の様子をBlenderで手作業で可視化してみた。片結びを回転させながらさらに全体を回転させてできるスイープ曲面を考える。
ＣＧと数学の融合　横山俊一、鍛冶静雄数学者がＣＧに首をつっこんでみた。安生さんのＣＲＥＳＴの話。ＣＧも高度になってくると数学が活躍できる。ただ、ＣＧの論文は、数学からみると、議論が厳密でなく感覚的で、間違いや勘違いが多い。

11/10/23 ISTyくん

情報理工学研究科の公式ゆるキャラ「ISTyくん」がデビューしました。よろしくお願いします。詳細はこちら。

11/10/24 UIST 2011

265本投稿で67本採択(25%)。参加者約340名。プレゼン時間は一つ13分(短!)。昔と違って、何もないところから自由に作るのでなく、すでに存在している複雑なリソースの上にたってそれらをうまく使いこなす（ハックする）必要がある。たとえば、アクセシビリティAPIとか、 eclipseなどのIDEとか、アプリケーションのスクリプト・プラグイン開発環境、クラウドAPIなど。複雑なことができるようになっている分、いろいろ習得しなくてはならず大変そう。

Instrumenting the crowd: Using implicit behavioral measures to predict task performance クラウドワーカーがきちんと仕事したかをチェックするのに、ＧＵＩ操作内容のログを分析する。品詞分類、画像タグ。既存手法は、指示を工夫する、正解既知問題や同じ問題を入れておく、多数決をとる、など。大体30%くらいはごみ。
Real-time Crowd Control of Existing Interfaces Legion VNCのクラウド版。リアルタイムで多数決をとる。多数決で個々のコマンドを決めると遅延がおきるので、多数決で操作するリーダーを選んで、その操作内容を使う。遠隔ロボット操作、手書き文字認識。
Crowds in Two Seconds: Enabling Realtime Crowd-Powered Interfaces Adrenaline　動画を撮ると、10秒でクラウドが答えを返す。あらかじめ呼び出されたらすぐに答える人を登録しておく。２秒ぐらいで反応する。次の3秒で現れる。次の5秒で結果を返す。他の人の結果を利用して加速する。
A Tongue Input Device for Creating Conversations 着ぐるみを着ながらセリフを選ぶための舌で操るジョイスティック。口や目はモータで動く。HMDを見ながら操作。
Pause-and-Play: Automatically Linking Screencast Video Tutorials with Applications ビデオチュートリアルを見ながらアプリケーションを操作するのを助ける。ビデオを画像認識してアプリケーションとの対応をとって、自動停止・再生をおこなったりコマンド間の移動をできるようにする。
Real-Time Collaborative Coding in a Web IDE Collabo Google Docs のように複数で同時にコーディングする。エラーだらけで動かなくならないように、コンパイラに通ったものだけをシェアするようにする。
Searching for Software Learning Resources Using Application Context ヘルプの検索・閲覧を支援するために、コンテクスト（どんなツールを使っているかなど）を利用する。
Keynote: Breaking Barriers with Sound 計算機を使った新しい演奏。 ChucK:周波数を指定して音を鳴らすスクリプト。Processingの音楽版? Laptop Orchestra: 全身ジェスチャー（首ふりとか）で音楽を演奏するのを大勢でやる。 Ocarina: iPhone に息を吹きかけてオカリナを演奏する。世界中で演奏されている曲が聴ける。 Magic Fiddle: iPad でバイオリンを弾く。
Monte Carlo Methods for Managing Interactive State, Action and Feedback Under Uncertainty 画像認識を使ったUIのように不確実性がある場合に、普通にプログラムを書くだけで、不確実性の部分をシステムが隠ぺいしてくれるようなツールキット。入力および遷移状態について、常に確信度付きの複数の可能性（サンプル）を保持して並列処理する。
Associating the Visual Representation of User Interfaces with their Internal Structures and Metadata PAX 画面に表示された画像を利用してアプリケーションを外から操作するシステム(Sikuri)の拡張。画像だけでなく、アプリケーションが外部に公開しているアクセシビリティＡＰＩを利用する。これによって、画像から内部情報を参照したり、内部構造を保持したままコピペしたりすることができる。アクセシビリティＡＰＩがない場合などには文字認識などを行う。
RhythmLink: Securely Pairing I/O-Constrained Devices by Tapping ワイヤレス機器同士の接続の確立にリズム（タップパターン）をつかう。センサーはなんでもよい。パターンの距離を保存するような暗号化を使う。
Tap Control for Headphones without Sensors イヤホンのタッピングでスマートフォンを操作する。イヤホン内のスピーカー自体をマイクとして使用する。
ZeroN: Mid-Air Tangible Interaction Enabled by Computer Controlled Magnetic Levitation 空中浮遊する玉を使ったTangible Interaction. システムが動かすこともできるし、ユーザが手で動かしてもよい。
Elasticurves: Exploiting Stroke Dynamics and Inertia for the Real-time Neatening of Sketched 2D Curves 手書きストロークをきれいにする。速く描くと大きく整形し、ゆっくり描くと元の形を保存する。
onNote: Playing Printed Music Scores as a Musical Instrument 紙の楽譜を画像認識して演奏する
Peripheral Paced Respiration: Influencing User Physiology during Information Work パソコンで作業しているときの呼吸のペースを整えるために、画面上でバーを上下させる。
SideBySide: Ad-hoc Multi-user Interaction with Handheld Projectors ２台のモバイルプロジェクターで画像とIRコードを同時に照射してトラッキングすることでお互いの相対位置がわかる。ベストペーパー
The 1Line Keyboard: A QWERTY Layout in a Single Line タブレット用のキーボード。画面スペースを占領しないように１列に並べた。
1 Thumb, 4 Buttons, 20 Words Per Minute: Design and Evaluation of H4-Writer 少ない数のキーで２６種類のアルファベットを入力するためにハフマンコードをつかう。
Detecting Shape Deformation of Soft Objects Using Directional Photoreflectivity Measurement クッションやぬいぐるみの中にいれて、つぶされているかどうかを検知するセンサー
Modular and Deformable Touch-Sensitive Surfaces Based on Time Domain Reflectometry ワイヤーやシートの端から信号を出して反射して戻ってくる信号を計測すると、指で触った位置（端からの距離）が取れる。
Direct and Gestural Interaction with Relief: A 2.5D Shape Display 上下に動く小さい板の集合からなる立体ディスプレイを両手ハンドジェスチャーで操作する。
KinectFusion: Real-time 3D Reconstruction and Interaction Using a Moving Depth Camera 手に持ったKINECTで環境をスキャンして、リアルタイムに３次元モデル化する
Vermeer: Direct Interaction with a 360° Viewable 3D Display 楕円体ミラーを使って、回転ミラーを使った立体ディスプレイの像に直接さわれるようにした。
Harpoon Selection: Efficient Selections for Ungrouped Content on Large Pen-based Surfaces 電子ホワイトボードで手書きストロークをペイントで選択する方法。筆の幅を速度に応じて変える。つけたり消したりもできる。
TapSense: Enhancing Finger Interaction on Touch Surfaces タッチパネルに触れるときの音をみることで、指のどこ（つめ、指の腹、関節）で触ったかを検出する。

11/10/16 UIST 2011 Doctoral Consortium

UIST の Doctoral Consortium に参加してきました。これは、博士取得間近の学生を集めて、博士論文審査および就職活動用の面接の練習をし、それに対して何人かの先生がアドバイスするというものです。通常だと指導するのは指導教官のみなので、このような機会を設けて広い意見を聞けるようにして、コミュニティとして新しい研究者の卵を支援しようというが目的のようです。個人的には特に「就職活動用の面接」練習という側面が面白かったです。大学ポジションへの就職はコンピュータサイエンスの他の分野の候補との競争という側面があるので、我々の分野の学生がよいところに就職できるかどうかは、分野全体の競争力に直結するとの認識があるようです。あとは、"I am not sure, but.."　とか ".. like.." のようについ口にしてしまいだけど、採用試験では不適切な表現を直すためには、自分の発表をビデオに撮って自分で見るのがよい、というような話も面白かったです。我々も卒論とか修論の発表練習も必ずビデオ撮ることにするといいかも。ちなみに内容は以下の通り。

Accessibility for Individuals with Color Vision Deficiency 色覚異常のために表示色を調整するためのキャリブレーション方法の提案。
Mobile Multi-Display Environments ピコプロジェクタつきモバイルデバイスでのインタラクション手法をいろいろ検討した。壁に投影するか、床に投影するか、など。
Designing for Effective End-User Interaction with Machine Learning ユーザが対話的にサンプルを与えるインタラクティブ機械学習において、学習結果の見せ方を改良したり（スコアの高いものでなく全体をカバーするようにサンプルを選ぶ）、過去に戻れるようにしたら、効率がよくなった。
Augmenting the scope of interactions with implicit and explicit graphical structures グラフィカルエディタで複数オブジェクトのプロパティを同時に編集できるようにする。
Advanced Interaction with Mobile Projection Interfaces ピコプロジェクタつきモバイルデバイスでのインタラクション手法を壁との距離に応じて分類した。一番近くは一人で、もう少し離れるとグループで、もっと離れるとパブリック。
Role-Based Interfaces for Collaborative Software Development ソースコードを複数人で同時に編集する。サーバー上にeclipse があって、それをEitherPad経由で編集する。コンパイルは個々人別に行って、通ったのだけをシェアする。
Using Graphical Representation of User Interfaces as Visual References スクリプトを書くときに画面キャプチャを使って操作対象を表現する。実行時には画像のパターンマッチで対象を見つける。あとは、モバイル機器でＰＣ画面を撮ると、ＰＣ上のアプリケーション状態がモバイル機器で再現される。

11/10/5 共創のかたち〜デジタルファブリケーション時代の創造力

京都芸術大学ギャラリーで行われている展示のトークイベントにいってきました。

ユーザーとメーカーの「共創」としてのハーレーダビッドソンのデザイン: ハーレーダビッドソンは最初ユーザによる改造を否定していたが、途中から積極的にカスタマイズを支援するようになった。
FabLab Japanにおける研究紹介: ３次元プリンタを３次元プリンタでつくる fablab 2.0
Fab Commons: Creative Commons のデジタルファブリケーション版
Sketch Chair System（エンドユーザーによる椅子デザインシステム）ユーザがスケッチを描くと椅子の設計図ができてレーザーカッターに送ると椅子ができる。
Latency: CADとラピッドプロトタイピングによる造形に漆を施した立体作品
FRU スツール（乾漆椅子）:船などの工業生産物に使われるFRPはカーボン（骨材）とプラスチック（構造材）の複合材。同じように乾漆も骨材となる布と構造材である漆からなる複合材ととらえ、工業生産物に利用してみた。
Open Design Project:インターネット上に椅子の設計図を公開している。誰でもダウンロードして鉄板を切りだして曲げれば椅子ができる。
PONOKO: オンラインでデザインすると、レーザーカッターで切ったものを送ってくれる。また、他人のデザインを購入することもできる。
talk では、漆作家（？）の土岐さんの話が面白かったです。スーパーのペーパートレイを漆で作るとか、漆塗りのザクを作るとか。大学では、漆塗りを職人芸でなく明文化された手続きにすることで、普通の人でもできるようにして、より安く広く使われるようにする活動もしているようです。

11/7/11 ERATO シンポジウム

7月23日(土)午後にERATOプロジェクトの成果報告シンポジウムをお台場の科学未来館で開催するのでよろしければご参加ください。これまでの3年半の成果をまとめてご紹介させていただく予定です。デジタルヒューマンの加賀美さんにもご講演お願いしております。詳細はこちらをご覧会ください。参加費無料です。スペースが限られておりますので、興味のある方はとりあえずでも参加登録をお願いします。少し遠いですが、未来館で開催中のもんもとすむいえの内覧会も行いますのでぜひご参加ください。

11/5/24 CHI 2011

Mid-air pan-and-zom on Wall-sized displays 大画面を空中での手のジェスチャーでパン・ズームするときのやり方をいろいろ調べた。片手vs両手、など。
Gesture Select　大画面タッチディスプレイで、離れたところのオブジェクトをジェスチャーで選ぶ。オブジェクトにユニストロークが割り当てられる。
User Defined Motion Gestures YangLi　　スマートフォンをジェスチャで操作するやり方をどうしたらよいか、エンドユーザにいろいろ聞いて調査したら、標準的なセットができた。
Gesture Avatar YangLi　スマートフォンで小さいオブジェクトを選ぶ方法。手書きストロークで形を描くと、それにマッチするオブジェクトが選ばれて拡大される。
TorusDesktop デスクトップ画面の上下や左右をつなげて、パックマンのようにワープできるようにする。
Comet and target ghost 動いているオブジェクトをクリックしやすくするために、残像をクリックできるようにしたり、シフトキーで、その場に一時的に止めたりできるようにする。
On the costs of multiple trajectory pointing methods 忍者カーソルは実際にはカーソルを選ぶのに時間がかかるので、それほど速くないことを実験で示した。
Importance driven compositing Window Management　　ウィンドウを部分的に透かしたり穴をあけたりして下のウィンドウを見えるようにする。
Prefab: Implementing advanced behaviors using pixel-based reverse engineering of interface structure 表示されたラスタを分析することで、インタフェースツールキットの動作を外から解析して、バブルカーソルやフォスフォーなどのさまざまなインタラクション技術を利用できるようにする。
Touch Input on Curved Surfaces 膨らんだりへこんだりした曲面をタッチするときの正確さを調べた。凸は正確だが、凹は不正確だった。
MotionBeam - Character Interaction with Handheld Projectors ハンドヘルドプロジェクタで壁に投影したキャラクタと遊ぶ
Grips and Gestrus on a multi-touch pen　ペンの周りにタッチセンサーをつけることで、持ち方によってモードを変えるようにした。
WYSIWYF: Exploring and Annotating Volume Data with a Tangible Handheld Device 大画面上のボリュームデータを操作するのにiPhoneを使う。
Eden: A Professional Multitouch Tool for Constructing Virtual Organic Environments 　MAYAをマルチタッチで操作できるようにした。Pixar
2D touching of 3D stereo objects ステレオディスプレイをタッチするときの様子を調べた。
TZee: Exploiting the Lighting Properties of Multi-touch Tabletops for Tangible 3D Interactions　テーブルトップに透明なジェルでできたPhyconを置いて操作する。
Rock & Rails: Extending Multi-touch Interactions with Shape Gestures to Enable Precise Spatial Manipulations　マルチタッチで回転したり拡大縮小したりするときに、手の形を認識することで、一様スケーリングなどの制約を付け加えることができる。
Multi-touch document folding　マルチタッチで画面上の平面を折る。いろいろな条件で実験して分析した。
FingerGlass: Efficient Multiscale Interaction on Multitouch Screens Mark Pauly　　テーブルトップで地図を操作。左手の親指人差し指で場所を指定すると、その間の領域が右下に拡大されて表示されるので、右手でその拡大領域の中で操作する。マジックレンズのマルチタッチ版。
An Interactive multi-touch sketching interface for diffusion curves マルチタッチでdiffusion curveの絵を描く。
SandAnimation マルチタッチで砂絵（テーブルの上に薄く砂を引いたもの））を描く。
Grids & guides: multi-touch layout and alignment tools 画面上のオブジェクトのレイアウトをするためのグリッドや整列ツールをマルチタッチで操作する。
Kineticons アイコンがもそもそアニメーションする
Temporal Distortion for Animated Transitions　物体の移動アニメーションに本当にスローアウトスローインがよいか実験で確かめた。
Chanti predicitve text entry using non-verbal vocal input　モールス信号のような声をだして文字入力する。
AirStroke: bringing unistroke text entry to freehand gesture interfaces　ビジョンによるジェスチャー認識でユニストロークのような文字入力を行う。
Magic Desk: Bringing Multi-Touch Surfaces into Desktop Work　実世界のデスクトップでＰＣの周りをマルチタッチにするとき、どの場所が使いやすいか調査した。 Tovi
ClearPlate 虫眼鏡状の２次元バーコードの読み取り装置。窓に収まるように置くと画像が取れる。
Ambient Help サブディスプレイに、メインディスプレイでの作業内容(CADなど)に応じたビデオチュートリアルやオンラインヘルプを自動的に表示する。Tovi
Tangible Bots　テーブル上の車輪ロボットを入力デバイスにする。
Geckos: Combining Magnets and Pressure Images to Enable New Tangible-object Design and Interaction 圧力センサーパッド(UnMousePad)の上に、ボールの足のついたパックを置くことで、phyconとして使う。
TUIC: enabling tangible interaction on capacitive multi-touch displays　静電容量タッチパッドの上に、疑似的なタッチ信号を発生するパックを置くことで、phyconとして使う。
tBox: A 3D Transformation Widget designed for Touch-screens　マルチタッチサーフェスで3次元操作をするためウィジェット
Rendering physical effects in tabletop controls テーブルトップの物理的なボタンやスライダーの硬さを磁石で制御する。
LiquidText active reading　テーブルトップ・マルチタッチでアクティブリーディングする。表示位置を入れ替えたりアノテーションしたりする。
Wrangler: Interactive Visual Specification of Data Transformation Scripts　エクセルなどでのデータの整理を支援する一連のツール。よくある操作をいろいろ細かく自動化する。

11/4/5 CHI 2010

去年の会議ですが、演習Ⅲ用に探したのでメモ書き。

Clutch-Free Panning and Integrated Pan-Zoom Control on Touch-Sensitive Surfaces: The CycloStar Approach　大画面のスクロールやズーミング
Occlusion-Aware Interfaces テーブルトップUIで、腕で隠れる部分を考慮して表示。
d.note: Revising User Interfaces Through Change Tracking, Annotations, and Alternatives プログラミング環境に手書きノートをつけられるようにした。
Using Text Animated Transitions to Support Navigation in Document Histories　テキスト編集のdiff をアニメーションで表示する。
Cooking with Robots: Designing a Household System Working in Open Environments　料理ロボット
Protractor: A Fast and Accurate Gesture Recognizer　ジェスチャー認識アルゴリズム

11/3/15 ロボティクスシンポジア 2011

今度はロボットの国内学会に参加してきました(指宿)。参加者200人で2日間泊りがけで議論する、ということで WISSに似ていますが、4パラレルで発表件数100件近くということでだいぶ雰囲気が違いました。 1発表30分で聴衆が20-40人くらいなのでより深く議論できている気がします。ロボットの機構の話から画像認識・プランニングまで幅広いのでパラレルがよいのかもしれません。あと、会社からの参加や発表も多く、学生さんを含めスーツの人がかなりいました。

GNSS マルチパス波判別を複合した精密単独測位による屋外移動ロボットの位置推定: ＧＰＳを使うときに建物からの反射波が問題になる。そこで、別途カメラ画像から空が見えている方向を検出して、その方向からくるＧＰＳ波のみを利用する。かしこい。ベストペーパー
複数仮説相関方式を用いた屋外環境における移動物体の識別及び追跡の実現: 屋外でレーザレンジファインダをつかって歩行者と自動車を識別・追跡する。パーティクルフィルタにクラスタを導入した。へー。
全体形状と局所形状分布の類似性による変形物を含む三次元計測データの分類: 形状情報で物体を認識するときに、ケーブルなどは全体形状がかわってしまうので、局所形状を利用する。少しＣＧっぽい。
多段プランニングによる異種機能ロボットの協調形態自立構成: 機能の異なるロボットが協調する。確実性を優先するか、時間を優先するかで、結果が変わる。まだ改善の余地ありそう。
ケーブルでつながれた移動ロボットのための経路計画: ケーブルが柱などに絡まらないように経路計画する。地味？
手探りによる複数物体からの目標物探索: 触覚センサが密についた手のひらで物を押したり転がしたりして物体（ボールやコップ）を認識する。かわいい。
MEMS 技術を利用した気流センサの研究: コオロギをまねて気流センサをつくる。印刷してつくった銅板を曲げて立てると風で検知するスイッチになる。こまかい。
屋外型飛行船ロボットの外乱下での飛行制御系設計法: 強風下での飛行船の飛行制御。直線、曲線、あるいは目標からのずれの大きさによって制御方法を切り替える。ふつう、かな。
テクスチャの少ない環境におけるステレオカメラによる平面復元: ステレオ視から得られる３次元エッジの集合を入力とし、それらの間の面を求める。ピクセルごとにどの面に乗るかのラベルづけ問題として定式化してグラフカットで解く。よくできてる。（個人的にベストペーパー）
ダイポール場を利用した平面上で物体を押して運ぶアルゴリズム: モードの切り替えやスケール依存パラメータがなく、ダイポール場の計算(cos2t, sin2t)だけで実現できる。かんたん。

10/12/14 WAFR 2010

ロボティクスのアルゴリズムに関する学会でシンガポールに来ています。普通の発表は「特殊な問題を持ってきて、それ用のアルゴリズムを考えて、分析しました」というようなのが多くていまいちでしたが（他人のこと言えませんが）、招待講演が６つもあって面白かったです。

手術用ロボットの話。CTスキャンしたデータをもとに、骨のどこにボルトを挿すか指定すると、ロボットがそこに正確に誘導する。やわらかい組織に針を通すと、変形してしまうので目的地に届かない。そこであえて「曲がる」針を使って変形を考慮した経路計画しながらロボット操作で針を挿入する。
自立分散協調ロボットの話。複数の飛行ロボットで地面の様子を撮影するときに、うまく全体をカバーできるように配置を最適化する。分散処理で局所的に最適化するので、台数が変わってもすぐに対応できる。自分で自動的に折りたたまる折り紙ロボット。自分で自動的に「削られていく」彫刻ロボット（多数のブロックが電子永久磁石(EPM)でつながれていて、いらない部分からはずれて落ちていく）。
水中で映像を撮影すると、遠いものは青みがかってしまう。そこで、距離に応じて異なるスペクトルの照明をあてることで、もとの色を再現した映像を撮る。
AI的なプランニングの話。通常は、知識は固定して、その知識をもとにプラニングする。しかし、知識はセンサ情報でアップデートされていくので、知識をどう足りないからどう集めるか、ということも含めて一番よい方法をプランニングする。

10/11/27 Eurographics Program Committee Mini-symposium

Eurographics のプログラム委員会に来ているのですが、委員会の後に、最近の研究をお互いに紹介するミニシンポジウムがあったのでその内容の一部を紹介します。すでに発表済みの内容ですが、全部読んでいたわけではなかったので勉強になりました。

Apparent Display Resolution Enhancement for Moving Images, SIGGRAPH 2010: １方向に動いている画像を見ているとき、網膜上の受容器一つ一つが検知する情報は、受容器が見ている点が通過するピクセルの色の積分になる（受容器が見てる点は時空間的に連続に動くが、ピクセルの色は時空間的に断続的に変化する）。積分した結果がきれいな画像になるように、ディスプレイに表示する内容を最適化すると、みかけ上の解像度があがる（一枚一枚をみると崩れているが、積分するとよりよい画像になる）。
Multi-scale geometry interpolation, Eurographics 2010: 2つの3次元形状の補間を考える。頂点座標の直接補間だと、形がつぶれる。回転する微分要素を補間して再構成するともっとうまくいくが(as-rigid-as-possible)、回転が180度以上のときに反対方向にまわってしまう危険がある。エッジの長さとDihedral角で形状を表現して、その表現で線形補間して再構成すると大きい回転も自然に扱える。（ただし、形状の再構成には非線形最適化が必要で時間がかかる）
Connection between Partial Symmetry and Inverse Procedural Modeling, SIGGRAPH 2010: 建物などの３次元モデルが与えられたときに、繰り返し部分を自動的に見つけてきて、さらにそれらの間の接続関係のルールを文法構造として抽出する。あとはその文法を使って、いろんなバリエーションを作ることができる。繰り返しの検出は、エッジの検出＋グラフマッチングによる。

10/10/29 ケーブルロボット

WAFR 2010 に投稿していたケーブルロボットの論文が無事採択されたのでよかったらみてみてください (ここ)。電源ケーブルにつながれたロボットが、ケーブルが障害物に絡まらないように移動するための経路計画のアルゴリズムになってます。アプレットも置いたので試してみてください (ここ)。アルゴリズムの論文なので、いまいち地味ですが。すでにありそうでなかったということでよかったです。実際世の中のロボットは、バッテリー駆動といいながら、なんだかんだで実際にはケーブルでつながっている場合がほとんどですから (バッテリーが安定しない、充電が面倒、倒れたときのため、などなど)、はじめからケーブルありきもありだと思います。

10/10/25 UIST 2010

今年はAmazon Mechanical Turk が大流行だったようです。

TurKit: Human Computation Algorithms on Mechanical Turk: mechanical turkを自分のプログラムの中からシステムＡＰＩのようにして簡単に呼べるようにする。
UIMarks: Quick Graphical Interaction with Specific Targets: デスクトップ上でよく行く場所を登録しておいて簡単にジャンプできるようにする。
Combining Multiple Depth Cameras and Projectors for Interactions On, Above and Between Surfaces: 複数デプスカメラでユーザの形状を計測することでいろんなインタラクションを実現する。
Soylent: A Word Processor with a Crowd Inside: mechanical turk を組み込んだワープロ。校正したり縮めたりといった作業をやってもらう。質を保つための検証を工夫した。
VizWiz: Nearly Real-Time Answers to Visual Questions: mechanical turk を利用して画像に関する質問に答えてもらう。
A Framework for Robust and Flexible Handling of Inputs with Uncertainty: 大きな指で小さなものを選択するといったあいまい性のある処理をあつかう。最初は複数同時に操作を開始して、最後に決定する。
Designing Adaptive Feedback for Improving Data Entry Accuracy: 入力者の操作内容にもとづいて入力順や選択肢の提示方法などを適応的に変更することで、データ入力エラーを減らす。

10/10/25 SIGGRAPH 2010

ひさしぶり（５年ぶり）に筆頭で発表してきました。

Structure-Based ASCII Art 線画をアスキーアートにする。
Programmable Motion Effects スクリプトに基づいて３次元モデルの動きの残像を３次元的なサーフェスとして生成する。
2.5D Cartoon Models ２次元的な絵をブレンドして３次元的に回転できるようにする。
Design and Fabrication of Materials with Desired Deformation Behavior 異なるやわらかさの部分からなる物体を計測して、３次元プリンタで再現する。ゴムぞうりとか。
RepFinder: Finding Approximately Repeated Scene Elements for Image Editin 画像中の繰り返しを自動検出してまとめて編集できるようにする。
Discrete Scale Axis Representations for 3D Geometry 輪郭の中心線をノイズによらず安定的にもとめる方法。入力の輪郭をいったん膨らませて、膨らんだ輪郭の中心線を求める。
3D Modeling With Silhouettes 正面と上からみた２次元の絵を描くと、visual hullをもとめて３次元オブジェクトを生成する。角を丸めることもできる。
Apparent Layer Operations for the Manipulation of Deformable Objects 折り重なった３次元の紐や布の重なり順をクリックで変更できるようにする。
Popup: Automatic Paper Architectures from 3D Models ３次元モデルから自動的に折り紙建築を作る
Multi-scale Image Harmonization poisson image editing などで合成した画像に適切なノイズを加えて質感を統一する。

他には、アニメーション、特に歩行の論文がいっぱいあったようです。

10/7/16 jCUDA

Java で使えるライブラリがあったのでCUDAでGPGPUプログラミングをしてみています。やってみた感想は以下のとおりです。

動かしてみるだけならとっても簡単。まずカーネルコードを書いてコンパイル。たとえば、スレッドが並列に配列の要素を2倍にするカーネルコードは

__global__ void twice(float* A){ A[threadIdx.x] *= 2; }
だけ(わかりやすい!)。あとは、Java の中で CUDA オブジェクトにコンパイルしたファイルを読みこませて、引数として配列を設定し、最後に要素数だけスレッドを起動すればよい。 C++でdllを書いてjniで呼び出すのよりもはるかに楽です（javahでヘッダーファイルつくったりしないといけない）。手元のノートパソコンでできるのも◎。
プログラミングおよびデバッグは手間がかかる。カーネルコードは単なるテキストエディタで書くのでIDEの恩恵が受けられない（設定がんばればできるのかもしれませんが）。また printf も使えないし、java と違ってランタイムに落ちたときに何がまちがったのかも教えてくれない。オブジェクトも使えない。同じコーディングするのにかかる時間は10倍くらいでしょうか。
性能を引き出すのは難しい。問題を適切にスレッドやブロックに分割して、メモリアクセスパターンが適切になるようにプログラムを書かなければいけない。どうしたら一番早くなるかは、いろいろ実験してみるしかない。いまのところ、現状のプログラムでは、残念ながら速度の改善は10倍程度です。もっとはやくなると思ったのに。(32マルチプロセッサなので、480個とか載ってるGPUなら100倍くらいになるのかも）
結論として、やはりUIの研究するだけなら、GPUプログラミングに時間をかけてチューニングするよりも、モデルの解像度を減らしたりして問題自体を簡略化してしまったり、まったく新しいアルゴリズムを考える方が効率がよいと思われる。

でもまあ、流行りものなので自分で動かしてみることができてよかったです。満足。

10/7/15 Theoretical Analysis

ロボットの経路計画のアルゴリズムの論文を書いているのですが、論文にアルゴリズムの正しさに関する証明をつけることになりました。前の論文でも少しだけ証明をつけたことがありました(これ)が、そのときはおまけで論文のメインの内容ではなかったので、きちんとした理論的解析のある論文ははじめてです。Definition とか Proposition とか Renma とか Proof とか Contradiction. とか、普段みない単語が並んでいます。正しさの証明されたアルゴリズムってなんか"computer science"という感じでかっこいいですよね。今回の証明のほとんどは共著になってくれたMikeさんのおかげです。さんきゅう。論文が通るといいのですが。

10/5/7 ICRA 2010

ロボット関係で一番大きい(?)国際学会。13パラレルセッション(!)で1つの発表は12分。2062の投稿で856本採択だそうです。個人的にはもっと選んだほうがよい気もしますが、そしたら自分の論文も通ってなかったかも…。

Autonomous Operation of Novel Elevators for Robot Navigation ロボットが全自動でエレベータのボタンを認識して操作できるようにする。通常の文字認識に加えて、ボタンの並びの規則性を利用して認識率を上げている。
Cloth Grasp Point Detection Based on Multiple-View Geometric Cues with Application to Robotic Towel Folding ロボットが両手で乱雑に積まれたタオルを順に持ち上げて広げてたたむ。一番難しいのはつかむ場所（タオルの角）の特定。輪郭をトラッキングして辺を見つけて、辺の交差点として角を見つける。全体のプロセスの制御には、状態遷移にエラーからの復帰を含めたものを使っている。 youtube
Modeling Non-Convex Configuration Space Using Linear Complementarity Problems 物理シミュレーションにおいて物体との接触をLCPで扱うときの手法の改良。よくある手法では、凸となっている部分でそれぞれの面の制約の単純な論理和をとっているが、そうすると結果的に本来接触しない領域でも接触していると判断してしまう。それを防ぐには距離を見るときにminをとればよいが、普通にやるとLCPの枠組みからはずれる。この論文ではmin をLCPの制約に変換することで統一的に解けるようにしている。
Robot Vision: Where it has been and where it will be 金出先生の講演。60年代からの線画の立体解釈の研究の説明。局所的な特徴に注目するのはよかったが、トポロジーに依存していたのが間違いであった。最近の画像からの車の認識の研究では、トポロジーによらず、全体的な最適化によってロバストな認識を実現している。また、遮蔽を扱うために、ランダムに見えている点と見えてない点を選んで仮に計算することを繰り返し、一番それっぽいものを選ぶようにしている(RANSAC)。研究一般についてのアドバイス。1) 問題の性質がNP Completeであっても心配しなくてよい。個別問題はちゃんと解ける。2) 学習による手法が全盛だが、モデルに基づく手法も大事。物理的な制約をきちんと考慮すべき。3) 多数使うと問題が解けることがある。昔5眼カメラの論文を出して、現実的でないとしてrejectされたが、今は1000台のカメラによるステレオを作っている。4) 伝統的なビジョンの問題にとらわれず、新しいアプリケーションに目をむけるべき。生物画像データの認識の研究例を紹介。
Towards a 10,000 Mobile Robot Smart Warehouse 基調講演。物流会社の倉庫において注文された物品を効率よく取ってくるロボットシステムを作っている。多数の床を走り回るモバイルロボットが協調して物品を運ぶ。充電も自動的に行う。実際に事業化されて1000台規模のシステムが稼動している(kiva systems)。もともとロボカップのサッカーの研究をしていた。システムが安定して稼動するように、効率のよい動きを自動的に学習する。
Computing Push Plans for Disk-Shaped Robots 手のないロボットがモノを押して運ぶときに、計算された経路にそってモノが動くように、壁に押し付けながら運ぶ。経路内の位置を横軸に、モノに対するロボットの方向を縦軸にとったconfiguration spaceを作成し、その中で最適なパスを計算する。連続的に押せないときには、回り込んで違うこところを押す。理論のみで実験はなし。
A Dipole Field for Object Delivery by Pushing on a Flat Surface 私の初めてのロボット論文。モノを押して運ぶロボットのための動作アルゴリズム。モノの周りにダイポール場を生成してその方向にそってロボットを動かす。また、同じアルゴリズムで、重い荷物を縦に並んで2台で押すこともできる。手のひらサイズのロボットとルンバで動作を確認した。詳細はこちら。
Avoiding Zeno's Paradox in Impulse-Based Rigid Body Simulation インパルスベースの物理シミュレーションにおいて、すでに接触状態にあるモノに衝撃が加わったときの処理の改善。普通は、一時的にモノ同士が干渉しあってから反発するが、提案手法では、一切干渉することなく処理できる。

10/4/25 予感研究所3

科学未来館でゴールデンウィークに開催の予感研究所3で、五十嵐デザインインタフェースプロジェクトの生活デザイングループの成果の展示を行う予定です。実際にデモプログラムを触ったり、実物に触れたりすることができます。よろしければぜひいらしてください。展示内容についてはここを参照してください。

10/4/5 Design Tools for Activity-based Ubiquitous Computing

University of Washington の James Landay教授に講演してもらいました。センサーのついたモバイル機器をつかって、人々の生活改善（健康になる、エコになる、外国語を勉強する）を支援するアプリケーションをいろいろと作っているようです。まず、人々の生活の様子のログをとるために、Experience Sampling Method (ESM: 携帯デバイスが定期的にユーザに現在の状況について質問する)をセンサーで支援する技術を開発した(MyExperience)。センサーデータから人間の活動を推論する（振動データから静止、歩行、走行、自転車、などを判断）方法なども開発した。さらに、そのデータに基づいてアプリケーションの開発するためのシステム Activity Designer を開発した。その上で、実際に、健康な生活(UbiFit)やエコな生活(UbiGreen)を勧めるアプリケーションを作成した。もともと Intel の研究所のグループでやっていたのですが、今はMicrosoft Research Asia で研究しているようです。システム論文は学会に通すのに苦労しているそうで、CHI,UISTに出し続けて4回目で通る、ということもあるようです。

10/4/1 Human Robot Interaction (HRI) 2010

初めていってきました。ロボットを相手にしたときに、人間がどうふるまうか、という研究が多い。

MeBot: A Robotic Platform for Socially Embodied presence テレビ会議デバイス。iPhoneに顔を映して、それに手足部品をつけてジェスチャーを表現する。
Robots Asking for Directions : The Willingness of Passers-by to Support Robots ロボットが、街中で、通行人に道案内を頼みながら目的地まで行く。
A Larger Audience, Please! Encouraging people to listen to a guide robot ロボットが人間を引き連れてガイドするときに、人間のツアーガイドのように、後ろを向きながら移動するようにする。
Judging a Bot By Its Cover: An Experiment on Expectation Setting for Personal Robots あらかじめ能力が低い用に見せておいたほうが、エラーが許容される。
Gracefully Mitigating Breakdowns in Robotic Services ロボットが失敗したときに、ユーザに許容してもらうために、あらかじめ「失敗するかも」と言っておく。
No Fair!! An Interaction with a Cheating Robot ロボットと人間がじゃんけん。ロボットが後だししたときの人間の様子を観察した。
Dance Partner Robot - An Engineering Approach to Humanrobot Interaction 招待講演。愛知万博で展示された、人間とダンスを踊るロボット。デザインはプロの衣装デザイナ。筐体はマネキン製作会社。もとは人間と協調してモノを運ぶロボットなどを研究していた。
Multimodal Interaction with an Autonomous Forklift iPhone を使って目の前のフォークリフトを操作する。
Toward Understanding Natural Language Directions 自然言語で、ロボットに道案内する。
Reconfiguring Spatial Formation Arrangement by Robot Body Orientation ロボットがグループに対して話をするときに、ロボットの顔・上半身・全身の向きの効果を調べた。
企業の取り組みの紹介。kokoro: 石黒先生のジェミノイドなど。 panasonic キッチン取り付け式のアームロボット。honda:アシモのための音声インタフェース　Hitachi: 足元にsegwayのようなタイヤのついた２足ロボット。Vstone ロボカップ用のロボットや、人を担げる２足ロボットなど。WillowGarage ロボット用のOpenSourceソフトウェア開発
A study of three interfaces allowing non-expert users to teach new visual objects to a robot and their impact on learning efficiency ビデオシースルーの画面の上で、線で囲うことで、オブジェクトの登録を指示する。ロボットは自動的にその周りを歩いて各方向からの「見え」を覚える、レーザーポインターとも比較した。

10/3/31 SIGGRAPH ASIA 2009

いまさらですが、SIGGRAPH のcommittee の仕事が終わって一息ついたので。日本語セッションとやらのおかげで自分の発表が4回もあったのであんまり聞けてません。

Continuity Mapping for Multi-Chart Textures テクスチャの境目を目立たないようにする。
Procedural Modeling of Structurally-Sound Masonry Buildings レンガを積み立てたような建物が物理的に正しく安定するように最適化する。
Symmetric Architecture Modeling with a Single Image 対称性を利用して、建物の写真から３次元モデルを復元する。
Rendering Surface Details with Diffusion Curves ３次元オブジェクトの表面にきれいなグラデーションつきのベクターテクスチャを貼り付ける。レンダリング時には、視点に応じて適応的に異なる解像度のテクスチャ画像を生成して表示する。
Sketch2Photo: Internet Image Montage キャンバスに、手書きスケッチとラベルを配置することで、自動的に画像検索して合成写真を生成する。
Printing Spatially-Varying Reflectance 与えられたBRDFを再現するようにいろいろな特性のインクを混ぜて印刷する。普通のカラープリンタと違って金属表面のような材質を表現できる。
Interactive Reflection Editing 反射面にどの方向の画像が写りこむかを、ユーザが自由に編集できるようにする。
Relief Analysis and Extraction ３次元物体の表面のでこぼこをベース面から分離して取り出す手法。高さを直接使うのでなく法線を利用する。
Abstraction of Man-Made Shapes 人工物の３次元モデルを単純化する。単なるメッシュリダクションよりも特徴をよく捉えた形を生成する。
Stochastic Progressive Photon Mapping フォトンマップ法でレンダリングする際に、光の集約を１点で行うのでなく広がりを持った領域として行うことで、視界深度のような効果を効率よく得ることができるようにする。
Structured Annotations for 2D-to-3D Modeling ２次元の画像の上に、２次元のプリミティブと制約をアノテーションとして与えることで、３次元モデルを生成する。 Teddy と違って、視点方向を回転させることなく１視点からの画像のみから３次元モデルを生成できる。
Analytic Drawing of 3D Scaffolds ２次元入力によって曲線を含む３次元のワイヤーフレームモデルを生成する。３次元曲線の形状を一意に決定することは難しいので、まず直線でガイドを作ってから、そのガイドとの位置関係から曲線形状を決定する。
Shadow Art 違う方向から光を当てると与えられた２次元形状に合ったような影ができるような３次元物体を生成する。
BiDi Screen: A Thin, Depth-Sensing LCD for 3D Interaction Using Lights Fields 触れていない指の表面からの高さをとることができるタッチスクリーン。

10/3/30 UIST 2009

今年は参加できなかったので、論文集から。テーブルトップ、マルチタッチの論文がたくさん。あとは、脳波や筋電、webブラウジングなど。

Ripples: Utilizing Per-Contact Visualizations to Improve User Interaction with Touch Displays マルチタッチで、各指の接触の様子を可視化してフィードバックする。
Contact Area Interaction with Sliding Widgets マルチタッチで、画面に触れた指先を点でなく領域と捉えて操作する。
Detecting and Leveraging Finger Orientation for Interaction with Direct-Touch Surfaces マルチタッチで、画面に触れた指のむきを検出して利用する。
Mouse 2.0: Multi-touch meets the Mouse マウスの上にマルチタッチセンサーをつけてみた。ベストペーパー。
EverybodyLovesSketch: 3D Sketching for a Broader Audience 手書きスケッチによるモデリングシステムを高校生に使わせてみた。
A Screen-Space Formulation for 2D and 3D Direct Manipulation マルチタッチによる３次元シーンの操作
Collabio: A Game for Annotating People within Social Networks SNS における人に対するタグ付けをみんなでやるためのゲーム。
SemFeel: A User Interface with Semantic Tactile Feedback for Mobile Touch-screen Devices モバイル機器の上下左右に触覚フィードバック装置を入れて、上下や左右の動きを提示する。
Disappearing Mobile Devices 指を感知できる豆粒大の入力装置とのインタラクション手法の提案
Abracadabra: Wireless, High-Precision, and Unpowered Finger Input for Very Small Mobile Devices 小型の腕時計型のデバイスの操作を、直接触れず、周囲で指を動かすことで操作する。
Virtual Shelves: Interactions with Orientation Aware Devices 体の周りに３次元的に仮想的に情報を配置して、モバイルデバイスで扱う。
Bonfire: A Nomadic System for Hybrid Laptop-Tabletop Interaction ラップトップの脇に小さいプロジェクタをつけて机面をワークスペースにする
Sikuli: Using GUI Screenshots for Search and Automation GUIの画面のスナップショットを使って、ヘルプを検索したり、スクリプトを書いたりする。
CommunityCommands: Command Recommendations for Software Applications 何千ものコマンドのあるアプリケーションにおいて、ユーザに、有用そうなコマンドを推薦する。
Relaxed Selection Techniques for Querying Time-Series Graphs 株価のような時系列グラフの一部をなぞって検索する。
Perceptual Interpretation of Ink Annotations on Line Charts 株価のような時系列グラフの一部を手書きアノテーションで選択する。
Changing How People View Changes on the We Webページ用のdiff。前回との差分をハイライトする。

2010/1/17 A Happy New Year

今年もよろしくお願いします。

09/12/8 PICMO

うるまさんと一緒に開発していたペイントソフトPICMOがようやく発売になりました。 MovingSketchの製品版です。描いた絵をつまんで動かすとすぐにアニメーションができます。さらにYouTube投稿機能があるので、すぐに全世界に作品を発表できます。プレゼンや論文のためのちょっとした図を描くのにも便利だと思うのでぜひつかってみてください。

09/9/25 国立台湾大学

国立台湾大学のマルチメディア研究グループ？を訪問してきました。 SIGGRAPHのほかCHIやubicompでもいろいろと発表しているらしく、勉強になりました。

Programmable Aperture Photography いろいろなパターンのフィルターを使って写真を撮ることでライトフィールドを撮る。撮影した結果をつかって、焦点をあとから変えたり、少し視点を変えたり、深度をえたりすることができる。SIGGRAPH2009.
High Dynamic Range Image Reconstruction from Hand-held Cameras 手で持ったカメラで露出を変えて写真をとってHDRイメージを得る。露出時間がながいとどうしても手ぶれがでるので、 HDRとブラー除去を同時に行うことでよりクリアな画像を得ている。CVPR2009.
Video Stabilization using Robust Feature Trajectories ビデオのぶれを取り除くときに、カメラパラメータを一生懸命推定するのでなく、特徴点の軌跡がなるべくまっすぐになるようにという処理を行うことで、画面の中に動く物体があってもロバストに推定できるようにする。ICCV2009.
SmartPlayer ビデオの早送りのときに、大事なところだけゆっくり再生するようにする。大事なところは動画処理で自動的に計算する。野球でホームランを打ったところ、ドライブで景色のいいところ（？）、監視カメラで動きのあったところ、など。CHI2009.
Playful Bottle コップに水をいれたものを携帯電話をつけたものを机の上においておき、定期的に水を飲むようにエンカレッジする。特に、複数人で情報を共有して協力しあうようにする。UBICOMP 2009.
Playful toothbrush 歯ブラシにセンサーをつけて、どこをどう磨いているかトラッキングして、きちんとした歯磨きをするようにエンカレッジする。CHI2008.

09/9/3 Elysium

CAD関係のソフトウェアを開発しているエリジオンにいって話をしてきました。異なるCADソフトのデータ変換ソフトウェアや、CADデータの不整合性を直したり、軽量化したりするソフトウェアをつくっているそうです。面白かったのは、フィレットのついたデータを受け取ってフィレットなしのデータに変換する、あるいは穴の空いたデータを受け取って穴を埋める、といった話で、一見すると元のデータは編集履歴を逆にたどればすぐにでてきそうなところなのですが、メーカーはデザイン過程を秘密にするために履歴を消去して扱うことがあるそうで、そういった処理の逆推定計算といったものが必要になるそうです。現場の細かいニーズにこたえていく地道な作業で、とても有用そうではありますが、学術研究にはしにくいなあという印象を受けました。

09/8/28 教員免許状更新講習

教員の免許更新講習の講師を頼まれて講演してきました。報道にもあるように、初回ということもあって残念ながら人があつまらず、聴衆は２名でした（あと事務局のJSTの方３人）。ただ、その分、先生方からも少し話を聞くことができてよかったです。数学の先生と理科の先生でしたが、３次元ＣＧがあったら何につかいたいですか、と聞いたところ、数学の立体図形の断面の説明や、化学にでてくる分子とくに錯体の３次元構造の説明に便利なのではとのご意見をいただきました。 09/8/21 SIGGRAPH 2009

PatchMatch: A Randomized Correspondence Algorithm for Structural Image Editing テクスチャ合成などに必要な操作である「局所的に似ている微小領域を探す」操作を効率的に行う。全部の画素を独立にチェックするのでなく、ランダムに点を取ってきて比較して、似たものが見つかったらその周囲を探索する。
Moving Gradients: A Path-Based Method for Plausible Image Interpolation ２つの画像の補間。入力画像のピクセル間の対応をまずとる(optical flow) のでなく、補間画像の各ピクセルがどの入力画像ピクセルに対応するかを計算する。さらに、ブレンド具合をピクセルごとに変えたり、隠蔽されているかどうかを補間結果から推測したり、ピクセル値でなくその微分を補間してポアソン方程式を解くことで、よりよい結果を得ている。
Optimizing Content-Preserving Projections for Wide-Angle Images 魚眼レンズでとった画像の歪みをなくす。直線が直線になるように最適化をかける。どこが直線にあるべきかはユーザが指定する。エッジや顔などは特に歪みが少なくなるようにする。
Content-Preserving Warps for 3D Video Stabilization 手で持ったカメラで撮影した動画のぐらぐらをなくして、いかにもレールの上のカメラからとったようにする。特徴点抽出で３次元的な世界を構成したあとで、カメラの３次元的な動きをスムーズにする。その後で新しいカメラからの視点を画像変形で合成する。合成にはブレンドでなく一枚の画像の局所的変形で行う。従来手法は完全に２次元的に処理するので不自然だった。
Photogrammetric Texture Mapping using Casual Images テクスチャマッピングのために３次元モデルと２次元画像の対応をとる。３次元形状変形するのでなく、３次元モデルのピクセルごとに独立にカメラパラメータを推定する。ユーザは少数の対応点を指定すればよい、
Preserving Topology and Elasticity for Embedded Deformable Models 物理シミュレーション(FEM)を荒いグリッドで高速に行う。あらかじめ細かいグリッドと荒いグリッドの関係をシミュレーションして前計算しておくことで、部分的に堅いとか部分的に空間があるとか枝分かれしている場合などを適切に扱うことができる。
Deformable Object Animation Using Reduced Optimal Control キーフレームを補間するときに、ダイナミクスを考慮して自然な動きを合成する。たとえば、足だけ動かしたキーフレームからしっぽの動きも合成する。基底として入力キーフレームとそれを直接補間したものをつかって、その基底の中で時空間最適化を行う。
Visio-lization: Generating Novel Facial Images 人間の顔画像をテキスチャ合成の要領で作成する。 parametric にベースの顔をつくって、patch-based で細部を合成する。
Self-Organizing Tree Models for Image Synthesis 木の成長のシミュレーションをインタラクティブにガイドする。成長してほしい領域をブラシのようにして動かしていくと、その部分だけ成長する。
Performance-Based Control Interface for Character Animation 体をその場で動かすだけで、仮想空間内で歩いたり泳いだり鉄棒したりできる。入力される体の動きのうち、必要な部分だけをとってきてマッピングする。システム内にはあらかじめ基本的な動きを登録しておいて、それとダイナミクスシミュレーションを組み合わせて動きを作る。
Achieving Eye Contact in a One-to-Many 3D Video Teleconferencing System 回転する鏡にプロジェクタで同期した画像を投影することで立体映像を作る。鏡を凹面鏡にすることで角度の精度を上げたり、画像認識で顔の位置を計測して適切な画像をつくるといった工夫をしている。
The UnMousePad - An Interpolating Multi-Touch Force-Sensing Input Pad マルチタッチで圧力を検出できるシート。縦横の配線をしたシートで圧力に応じて抵抗の変化する層を挟んで、すべての交差点でスキャンして計算する。工夫として、実際に計測するワイヤ以外にダミーのワイヤーを置くことで応答を線型にしている。
Generating Photo Manipulation Tutorials by Demonstration フォトショップなどの操作履歴から自動的にチュートリアルを生成する。またそれを一般化してマクロとして利用することもできる。コンピュータビジョンを使うことで人間の顔のパーツや空などを自動認識する。
Coordinates for Instant Image Cloning グラディエントドメインでの画像編集をするときに、明示的にポアソン方程式を解くのでなく、mean value coordinates を使うことで高速に近似的に計算する。
Dark Flash Photography 不可視光をつかったフラッシュで撮影した写真と、普通の写真を組み合わせて、暗いところでもはっきりした写真を撮る手法。普通のフラッシュと違ってまぶしくない。
A Visibility Algorithm for Converting 3D Meshes Into Editable 2D Vector Graphics ３次元モデルを２次元ベクトルグラフィクスとしてレンダリングする。自己遮蔽しているオブジェクトをうまく前と後ろに分割するところがポイント。
Local Layering フォトショップなどのレイヤー構造は全体的に上下関係を決めなくてはいけない。提案手法では、部分的な上下関係を指定することができる。
Automatic and Topology-Preserving Gradient Mesh Generation for Image Vectorization 写真を入力として与えると、自動的にグラデーションメッシュに変換する。
Bokode: Imperceptible Visual Tags for Camera-based Interaction from a Distance 目に見えないくらいの小さなバーコード。コードの前にレンズをおくことで、ピントを無限遠にしたカメラではっきり見ることができる。

以下は Sketch-based interfaces and Modeling 2009 より。

Automatic Colorization of Grayscale images using multiple images on the Web 白黒画像に自動で色をつける。画像データベースから似た画像を検索してきて、その画像を基にして色をつける。局所的に似た場所を参照して色を持ってくる。
PhotoSketch: A Sketch Based Image Query and Compositing System 手書きスケッチを元に似た画像をデータベースから探してくる。その上で、画像を切り貼りして、オリジナルの画像を作る。

09/7/4 骨展

ミッドタウンの骨展のトークショーにいってきました。緒方さんと私、そしてウェブデザイナーの中村勇吾さんの３人で司会はＮＨＫの中谷さんでした。以下、記憶が曖昧ですが、印象に残った言葉。中村さんの話「（デザインとアートの違いについて聞かれて）デザインとはすでにあるニーズに対してソリューションを提供するものであるのに対し、アートとは、こんなことを考えないといけないんじゃないの、こんなことも必要なんじゃないのといった、ニーズを提案するものである。」緒方さんの話「インタフェースをデザインするときには、使う人にプレゼントをつくるような気持ちでデザインする。素敵なプレゼントをもらったときのような驚きと喜びを提供したい」

09/6/23 CHI2009

いまさらですが、いくつか

SmartPlayer: User-Centric Video Fast-Forwarding ビデオの早送り
ESPranto SDK: an Adaptive Programming Environment for Tangible Applications タンジブルアプリケーションの開発用ツールキット。子供用なのが特徴?
Finding Causes of Program Output with the Java Whyline 現象を指定すると、その理由を教えてくれる、デバッガー。Java版を開発して実験した。
DesignableVisualMarkers QRコードやARツールキットのようなマーカーをユーザが自由に描けるようにする。
GestureBar: Improving the Approachability of Gesture-based Interfaces ジェスチャーインタフェースの使い方を教えてくれるツールバー

我々のところからは以下の２つ

Magic cards: a paper tag interface for implicit robot control 部屋にロボットへの指示（掃除やモノの移動など）を書いたカードをおくと、いない間に作業をしてくれる。
Sketch and run: a stroke-based interface for home robots タブレット上で、線を引くと、それにしたがってロボットが動く。

そのほかにも大量にエスノの論文やら、ポインティングやら、テーブルトップ（マルチタッチ）やらがありますが、まあもういいでしょう。

09/6/11 R25

「25～30歳って、自分のことを考える最後の期間だと思います。 30歳を過ぎると、雑事が増えて人間関係もどんどん複雑になって、自分のことばっかり考えてられません。」 by 久米宏

そうですよねー。研究職だって、リソースの制約などもあって、だんだん自分の考えだけでは好き勝手なことができなくなってきます。 20代に何を考えてきたかでその後の研究人生で何ができるか大体きまってきちゃうんじゃないでしょうかそういう意味で、学生さんは、スキルを身につけるだけでなく、じっくりと何をやりたいのか、何を目標にしていきたいのか、若いうちにしっかり考えておくことが大事だと思います。後の人生は、そこで設定した目標を30年かけて追いかけていくことになるのだと思います。

09/5/29 骨展

東京ミッドタウンで開催している骨展に招待作家ということで参加させていただいています。壁に投影された自分の影が勝手に動き出すというインスタレーション (another shadow)です。私は最初の技術提供だけで、展示は基本的に緒方さんがつくったものですが、よかったら見に行ってみてください。プレスリリース、内覧会で、展示物を見させていただきましたが、個人的な一押しは、六本足で超高速で走り回る昆虫ロボットの phasma です。会場では、机に縛り付けられているのが少し残念。

09/5/18 ICRA

ロボット関係の国際会議ICRAが神戸で開催されていたので行って来ました。自分のこれまでの研究分野とはまったく異なる学会だったので、新鮮な感じでした。でもまあ、似たようなノリの論文も結構あることがわかったので、少し安心もしました。投稿数は1626で採択率は43%だそうです。13パラレルセッションでとにかく大量の論文が発表されている印象でした。部外者からみると、もう少し厳しく選んだ方がいいのではと思いましたが、規模を維持するためにたくさん採らざるを得ないとの話も聞きました。内容は、制御・ビジョン・機構・特定分野(医療・航空・宇宙・ナノ)などに加えて HumanRobotInteractionというのもありました。 Physical HRI というのもありましたが、こちらはハプティックデバイスのハードウェアの話が中心でした。以下、いくつか論文紹介

Where to Go: Interpreting Natural Directions Using Global Inference 自然言語での場所の指示(キッチンを通り過ぎて次のドアを右、とか)を理解するための推論方法(Random Markov Field)。Frickrを使って、モノと場所の関係を学習する。MIT.
Insect Powered Micro Air Vehicles 空を飛ぶロボットの動力としてでかい蛾を使う。風船に蛾をつけて方向を制御する。実際に目的の位置に移動できてました。なんでもありですねー。コーネル大。
AffectiveEye: Augmented Gaze Representation for "what is the robot looking at". ロボットがどこを見ているのかを示すために、ロボットの目の色を、見ているものの色と同じにする。早大。
A Harmonic Potential Field Approach for Navigating a Rigid, Nonholomic Robot ina Cluttered Environment ロボットの移動経路を計画する方法として、ポテンシャルフィールドを利用する方法を提案する。サウジアラビア。
Information Retrieval System for Human-Robot Communication Asking for directions. 屋外を移動するロボットが、目的地への経路を、人に聞きながら学習していく。インタラクションはタッチパネルで行う。ミュンヘン大。
Real-Time Monocular Visual Odometry for On-Road Vehiclers with 1-Point RANSAC 車にオムニカメラを搭載して50km/hで走りながら環境地図作成と自己位置推定を行う。車の微小移動は一定半径での回転で近似できることを利用して高速化を実現。かしこい。発表もうまかった。ETH.
Robust 3D SLAM with a Stereo Camera Based on an Edge-Point ICP Algorithm ステレオカメラでの屋内で移動しながらの環境地図作成と自己位置推定。 LKFやSHIFTなどの特徴点が取り出しにくいので画像処理でエッジとなる画素を特徴点として利用する。千葉大。
Synthesizing a Desired Trajectory and Sensory Feedback Control Laws for and Origami-Foliding Roobt based on the Statistical Characteristics of Direct teaching by a Human 折り紙の折り方を人間の実演から学ぶ。タイトルながすぎ。京大。
Planning the Reconfiguration of Groudned Truss Structures with Truss Climbing Robots that Carry Truess Elements ロボットが自分よりも大きい構造物を構造物に登りながら作っていく。スケッチで有名なHod Lipsonの論文。
Climbing Rough Vertical Surfaces with Hierarchical Directional Adhesion　壁を垂直に登っていくロボット。やもりのように、手足の裏に細かい突起のあるゴムをつけてある。Stanford.

全体として、やはりsiggraphのように、問題をうまく数学的にモデル化してうまい解き方を提案しているのがいい論文とされている印象を受けました。あと、siggraphとかと違って、検索してもすぐにpdfとかvideoが出てこないのは不便です…。みんなどうやって情報収集してるんでしょうかねえ。

09/3/5 舘暲先生最終講義

最初は、バーチャルリアリティについての一般的な講義。バーチャルとは、本質とか実質とか言う意味であり、意味的にはリアルに近い。仮想現実という日本語はふさわしくない。ＶＲとは空間・相互作用・自己投影、という３つのコンセプトの融合であり、当時のさまざまな分野が集まってできている。その後は、これまでの研究。ユーザの周囲を覆う円筒形の立体ディスプレイ Twister, 遠隔地のロボットをあたかも自分がそこにいるかのように操作する Teleexistence, 離れたところでもちゃんと存在感のある遠隔テレビ電話 TelesaPhone, などなど。後半は、Teleexistence 誕生の経緯。最初は盲導犬ロボットをやっていた。その後、ＭＩＴの Robert Man のところで研究しているときに思いついた。その話が広がって、極限作業ロボットの大型プロジェクトの一部になった。ロボットには他者としてのロボットと分身としてのロボットがある。最後の質問に答えて。大事なのは常識にとらわれず、原理原則にたちかえってよく考えること。それと、よく勉強すること。すべては無理なので、両極端、すなわち基礎と最先端をよくまなぶこと。

09/3/4 杉原厚吉先生最終講義

前半は研究の話。学生のころは概念構造の研究をやっていたが、世の中をしらずにテーマを探すのはつらいので、問題のころがっている電気総合研究所へ就職した。とうじはパターン認識の大型プロジェクトがうごいていて問題がいっぱいころがっていた。最初は、線画の認識の研究をしたが、パラメータチューニングが大変なのを実感して、誤差に影響されない研究をしようとおもって、組み合わせ構造をきちんと考えた、誤差に強い手法を開発した。成果は Machine Interpretation of Line Drawings という本にまとめた。しかし、実際に利用しようとすると、カメラ画像はノイズばかりで利用できず、デザイナは３面図で書くのので必要ないといわた。実世界で役に立つ研究をしたい、ボロノイズの研究をはじめた。ここでも、位相構造を考慮して、誤差があっても正常に動作するアルゴリズムを開発した。これを拡張して絶対破綻しない計算という意味の超ロバスト計算原理として、いろいろな分野に広げていった。ただ、世界的にはあまりはやっていない。
後半はその他の話。専門外の本として、理系のための英作文という本などを書いた。イラストを本に載せたり、かけこみ寺の住職としていろいろな人の相談にのったりしている。最近は、だまし絵について、ワークショップをしたり本を書いたりしている。最後のまとめは、「数理工学とはテーマを探すこと」ということでした。

09/3/3 原島博先生最終講義

前半は自身の研究の話。最初は情報理論の研究をしていた。当時の成果はIEEEの通信の規格に使われている。 30代には、情報理論の応用として、脳の中の処理のモデル化なども行った。 40代には、画像を直接送るのでなくモデル化してパラメータだけを送るモデルベース符号化の研究を、顔を主な題材として行った。 50代には、顔学会、VR学会、東大情報学環の設立など組織運営にかかわった。 60代には、科学技術を文化にすることを目指して、教育プログラムや研究プロジェクトを推進してきた。後半は歴史の話。コンピュータの歴史、技術の歴史。これまでは、科学中心だったが、これからは、芸術と科学の融合が重要である、とのこと。
自分の研究ができるのは40代までだそうです。あと15年？

08/12/17 取材

新聞の取材の中で、「仕事をしていく上で一番大切なことはなんですか」、みたいなことを聞かれた。すぐに思いつかなかったのでうーん、と考えていたら、「ノーベル賞を受賞された○○さんは、大切なのは好奇心だと言っていました」という話をされて、それは自分とは違うと思った。好奇心が大事というのは真理を探究することを目的とするサイエンスの人のコメントであり、私の興味とは異なる。私にとっては、「できなかったことをできるようにしたい」「誰もみたことのないモノを新しく作り出してみんなを驚かせたい」というのがモチベーションである気がする。そういう意味では、サイエンティストというよりもエンジニアであり、さらに言えばアーティスト・クリエータとしての側面が強いのかもしれない。

08/11/21 日英HCIワークショップ

日英HCIワークショップというのに参加してきました。英国大使館主催の日本と英国のHCI研究者の交流会みたいなものでした。普段聞けない研究の話も聞けてよかったです。

Surface Computing (Steve Hodges) マルチタッチの研究の話。液晶の裏にLEDとセンサーのアレイをつけてマルチタッチにする話やリアプロジェクタをつかったテーブル型ディスプレイでマジックレンズを実物体でやる話 (SecondLight)、首からぶら下げたカメラで映像を撮り続けて記憶の補助にする話(SenseCam)など。
The state of research in the UK (Yvonne Rogers) 欧州でのHCi研究の現状について。HCI研究のフォーカスはもはや「機器の使いやすさ」ではなく、人間の生活をどう豊かにするか、というように、もっと広がってきている。森で環境の湿度をはかる携帯計算機や血液のグルコース濃度をはかる携帯機器など、主にユビキタスコンピューティング関連の研究を紹介していました。 HCI研究の主題だけでなく方法論が変わってきているというのは、たしかになんとなくは感じてましたがはっきりいわれるとなるほどなと思いました。
Toward natural "let it be" interface (Hideyuki Nakashima) 西洋の思想はすべてを把握した神の視点。東洋の思想は逆に自分の周りのみしか見えない虫の視点。虫の視点からのシステムデザインが重要。理想のインタフェースはワンボタンインタフェース。押せば状況に応じて必要なことをしてくれる。耳につけて近くのデバイスから発せられている情報のみを聞くデバイス（CoBit)。押すと映像がみえる虫眼鏡デバイス。
Interface that leverage sensors and spontaneous networking (Hans Gellersen) 複数の携帯機器の連携について。ノートＰＣにＵＳＢドングルをさすと、超音波でお互いの相対位置を検知して、無線接続するときにどのマシンがどの方向にあるのかを画面で教えてくれる。二つの携帯機器で情報交換するときに、物理的にその２つの機器が一緒であることを示すために、一緒に「振って」その動きが一致していることで認証を行う。シートの上に物理的なボタンやスライダーなどをぺたぺたとつけていくとそれがそのままwidgetとして動作する。
Future mobile user experiences (Matt Jones) 画面を見ないですむ携帯機器。ひとつは手の中に納まるマッチ箱サイズのデバイスで、近くに情報源があると振動して教えてくれる。ひとつは音楽で道案内してくれるもので、音楽がよく聞こえる方向へ歩いていくと目的地に着く。あとは、インドでのコミュニティ支援システムの話。字が読み書きできない人がいかに計算機でコミュニケーションするか、という話が面白かった。
At a Crossroads: HCI and Chaning Linves (Yvonne Rogers) 遠隔会議で画面だけだと阻害されるので、ディプレイに顔を映した移動ロボットとして会議に参加する(HP mobile telepresence)。旅行会社で相談するのに、カウンター越しに店員がひたすら端末を操作するのでは客にフラストレーションがたまる。なので、横に並んで一緒に操作するような３画面式の端末を提供した。部屋のレイアウトを複数で行うのに、タンジブルなphyconを使った。
helping people to collaborate to learn though their surroungings (Naomi Miyake) 人間は自分が知っていることについては他の人も知っていると思い込む (ミシシッピー川の長さを知っているひとは何パーセントいると思いますか？といった質問の答えが、あらかじめ長さを教えた場合と教えない場合で有意にことなる)。学習は複数で作業しながらやると効率がよい。それは、一人が作業している間に、もう一人はその作業をより抽象化した視点から見ることができるからである。例：折り紙の3/4の3/2を塗りつぶせ、というと、２人ときの方が先に半分でよいことに気づく。認知科学の講義で、協調しながらやった方が協調しないよりも、学習効果が高かった。

余談ですが、アメリカとイギリスの文化で何か違いがあるかという話をしていたときに、歩行者の信号無視の話が話題になりました。信号無視(jaywalk)ですが、イギリスでは自己責任ということで法律違反ではないが、アメリカでは明確に法律違反になるそうです。で、とあるイギリスの教授がアメリカで警官の注意を無視して信号無視をしてしまったところ、その場に張り倒させれ逮捕されて犯罪者として処罰されたことがあったそうです。海外にいったときは何で逮捕されるかわからないのでおっかないです。

08/10/28 UIST 2008

カリフォルニア、サンフランシスコ郊外のモントレーで開催でした。

Video Object Annotation, Navigation, and Composition ビデオに対して特徴点トラッキングをして、ひとまとまりで動くセグメント＝オブジェクトに分割する。そのあとで、ユーザはビデオ中のオブジェクトにアノテーションやハイパーリンクをつけたり、オブジェクトをつかんでドラッグしたりすることができる。
Annotating Gigapixel Images 巨大な画像の中に、局所的にテキストラベルやサウンドといったオブジェクトを埋め込む。場所とズームレベルから現在の視点とオブジェクトの距離を計算して近いものを提示する。
Kinematic Templates: End-User Tools for Content-Relative Cursor Manipulations マウスの物理的な動きからカーソルの動きへのマッピングを加工することでいろいろな効果を生じさせる。画面上に置くフィルタとして実装されていて重ね合わせなどができる。
Bringing Physics to the Surface ベストペーパー。マルチタッチディスプレイで物体を操作するときに物理シミュレーションを利用する。入力画像中からパーティクルを生成してそれをオプティカルフローで動かして、それで物体を押したり（衝突）引きずったり（摩擦）できる。両手を使って、ボールを転がしたり、板を積み上げたり、布をたたんだり、紙を破ったりできる。
Design As Exploration: Creating Interface Alternatives through Parallel Authoring and Runtime Tuning インタフェースをプログラミングするときに、複数のデザインを同時に実装して試せるようにした。ソースコードエディタにタブがあって複数のバージョンのコードを同時に編集できる。ソースコード中のパラメータを編集できるスライダが自動的に生成される。携帯電話用や組み込みデバイス用もつくってみた。
"Is the Sky Pure Today?" AwkChecker: An Assistive Tool for Detecting and Correcting Collocation Errors 文法チェッカーでは判定できない、非ネイティブの間違いやすい用法間違いを直すためのインタフェース。怪しいフレーズがハイライトされ、クリックするとフレーズをいれるとコーパスを検索して用例を示してくれる。
ILoveSketch: As-Natural-As-Possible Sketching System for Creating 3D Curve Models ３次元的な線画（スケッチ）を描くためのツール。重ねがきで曲線を描く機能、ジェスチャーで編集する機能(axis widget)、２Ｄから３Ｄの推論のしやすさ(sketchability)を評価する機能などがある。
Edge-Respecting Brushes フォトショップのような画像編集で、画像中のエッジをはみ出さないような領域選択・効果付与を実現するブラシを提案している。カーソルの位置から似たピクセルをたどっていって塗りつぶす。ペンには半径があってそこからはみ出ないように押しかえす。塗りつぶしたり、コントラスト変えたり、スムージングかけたり、に使える。
Scratch Input: Creating Large, Inexpensive, Unpowered and Mobile Finger Input Surfaces 壁に小型マイクをつけて指でこする音を聴いてジェスチャーを入力する。直線、円、三角、四角で音のパターンが違うので判別できる。
Lightweight Material Detection for Placement-Aware Mobile Computing 携帯電話が自分が現在いる場所（ポケット、机、かばん、など）を自動的に判断する。ＬＥＤとセンサーの組みあわせで材質を判定する。
Foldable Interactive Displays 扇子や新聞や巻物などに画像がぴったりあうようにプロジェクタで投影する。スクリーンになる対象にＬＥＤをつけてWiiリモコンでトラッキングする。ビデオ必見。

個々の発表はともかく、個人的には主要なＣＧ・ＵＩ関係者がロボットに手を出し始めているのを知ることができたのがもっとも大きな収穫でした。一人は昨年のSIGGRAPHのチェアで MERAL から Disney に移った Joe Marks で、テーマパークで使うことを考えているらしい。もう一人は、今年のUISTのチェアの Steve Cousins で IBMの研究所を辞めて Willow Garage のCEOとして家庭用ロボットの研究をはじめたらしい。Willow Garage はシリコンバレーの大金持ちが私財を投じて作った研究開発会社で、とにかく儲けを気にせずひたすら研究していればよいらしい。６０人の研究者を無期限で雇うというから相当な金額ですよね。

08/9/28 中国雑感

バイクが全部電動バイクになってる！とっても静かで排気ガスもないし、いい感じです。日本はまだガソリンですよね。日本も、近いうちに一気にガソリンがなくなって電動になるのでしょうか。
滞在中に、中国初の有人宇宙船の打ち上げがあって大々的に報道されていた（宇宙遊泳もするらしい）。でも日本ではほとんど報道されていなかったような。日本のマスメディアの情報だけだと世界で何が起きているか把握するのは難しいということを実感させられます。
旅行ガイドには「電源プラグの形はいろいろである」、としか書いてなくて心配していたのですが、逆にどんなプラグでもさせるコンセントになっていて心配無用でした（写真）。
ホテルにはどこでも部屋にインターネットがきているので安心。ただ、ＬＡＮケーブルが短いので長いのを持参した方がよい。
物価はそれほど安くない気がする。旅行者として、それなりのサービスを受けたりそれなりの品質のものを買おうとすると、日本と変わらないくらいかかる気がする。
中国を旅行する場合には、中国人でもガイドをつけるのが一般的。ガイドには全国的な免許制度があり、免許があるとガイド中の観光名所の入場料がただになる。レンタカーなどはなく、総じて自分で計画して旅行をするのは難しいらしい。

08/9/27 Chinagraph

Chinagraphで招待講演をしてきました。グラフィクス関係の中国の国内会議で日本でいうビジュアルコンピューティングのようなものだと思います。査読をわりときちんとやっているようで、 200本の投稿から23本だけ発表できるみたいです。で、選ばれた論文は、日本でいう情報処理学会の論文誌で出版されるようです。期間は3日間で毎日２つずつ招待講演がありました。招待講演以外は中国語なのでまったくわからず。

Realtime Computer Graphics by Kun Zhou. GPU を使ったモデリング・アニメーション・レンダリング・プログラミングの話。モデリングについては点群からの面生成にOctTreeを使う話、アニメーションについてはラプラシアンを利用した非線形計算のベクトル演算にGPUを使う話レンダリングについてはレイトレーシングの高速化にKDTreeを使う話、プログラミングについてはＧＰＵ用のストリームプログラミングフレームワーク (BSGP)の話をしていました。KunZhouは最近MSRAをやめて折江大学に移ったそうです。
Visualizing Social Networks by Kwan-Liu Ma インフォメーションビジュアリゼーションの話。テロリストネットワークや携帯電話利用データの可視化の話と、大きなグラフを高速にレイアウトするのに再帰的空間充填曲線（ヒルベルト曲線など）を使う話をしてました。あと、最近アメリカで始まった国家プロジェクト(?)であるVisual Analytic を紹介してました。後者は主に防衛目的の話らしいです。
Volume Data Expliration Based on Differential Topology by Issei Fujishiro サイエンティフィックビジュアリゼーションの話。藤代先生がここ１０年くらいやっているプロジェクトの概要。ボリュームレンダリングを見やすくするために、ボリュームデータのトポロジー構造を利用する。まずトポロジー構造を分析して(isosurface遷移の特異点を見つける) それを木構造で表現する。その上でその木構造を利用してボリュームレンダリングのときの transfer function を調整する（重要なisosurfaceを見やすくするように色・透明度を調整する）。その他、見やすい視点を探したり、見やすくなるライト方向を見つけたり、時系列方向での重要なポイントの発見に利用したりする。

08/8/23 収録

NHK高校講座情報Aの収録にいってきました。アニメーションを作ろうというテーマの中で、 movingsketchを使ってみるという趣旨でした。 10月9日(木)15:00-15:30だそうです。いつものことですが、プロの出演者のしゃべりには感心させられます。カメラが回り始めた途端にあがるテンションの高さにびっくりです。ちなみに8月29(金)22:55-23:00の匠の肖像という番組にも出演してます。

08/8/21 陰山先生の講演

百ます計算などで有名な陰山英男先生の講演を聞いてきました。趣旨は「百ます計算や漢字・英単語の学習などの繰り返しの必要な基礎的な学習には、計算機が非常に適しているのでうまく活用していくべき」ということでした。ＤＳの百ます計算ソフトなどをはじめとして、メーカーといろいろな取り組みをしているそうです。大筋ではとくに目新しい話はなかったですが、日本の教育の将来を真剣に心配し、良くしていこうという姿勢が強く印象に残りました。また、諸外国における日本の教育の位置づけや提案する教育手法の効果などについて、さまざまなデータを出して裏づけしているところに説得力を感じました。私としては、基礎的な学習だけでなく、思考力や創造力といった発展的な学力をつけるためにコンピュータをどう利用できるかに興味があるのですが、陰山先生の答えは「今のコンピュータはまだそこまでいっていない」とのことでした。確かにおっしゃるとおりですが、将来の可能性まで否定されたわけではないようなのでよかったです。将来、現場でつかってもらえるような技術を開発できるようにがんばっていきたいと思います。

08/8/16 SIGGRAPH 2008

去年よりも参加者が減った印象でした。論文は、すごく目新しい成果というわけではないですが（すでに解かれている問題を別の解き方で解いたといったものがおおい）、個々の解き方にそれぞれ「なるほど」と思わせる工夫があって、参考になります。プレゼンがよくできているので、それぞれのトピックのことがよくわかるというのもありがたいです。論文以外のセッションの発表では、プロダクションにおける映像製作ノウハウの共有という側面が大きくなってきている気がしました（だいぶん前からそうかもしれませんが）。

Factoring Repeated Content Within and Among Images 画像の中の繰り返しを見つけて効率よく圧縮する。画像を小さい代表要素＋マッピングに分解する。
Finding Paths through the World's Photos 撮影視点のわかっている大量の写真の集合の中を移動する。
Improved Seam Carving for Video Retargeting Seam carving をビデオに拡張。ダイナミックプログラミングをグラフカットに変更し、ピクセル除去後に余計なエッジがでないような処理を加えた。
Unwrap Mosaics: A new representation for video editing ビデオ中の物体の上に落書きすると３次元的に追従する。特徴点をトラッキングして自動的にテクスチャマップを生成する。
Robust Treatment of Simultaneous Collisions 布と剛体との複雑な衝突を扱うための手法。LCPのように法線方向の連立方程式を解くのでなく動きを接線方向に制限して計算する。
Backward Steps in Rigid Body Simulations ユーザの与えた最終状態になるように、物理シミュレーションで時間を逆方向へ動かす。また、複数の可能性がある場合には、実際にシミュレーションを多数実行した結果から適宜サンプリングして利用する。
AppProp: All-Pairs Appearance-Space Edit Propagation 画像編集するときに、だいたいの領域選択をすると、画像中の似た領域が自動的に選ばれる。
Discrete Elastic Rods 細いワイヤーのねじれを表現する。明示的に頂点座標を表現し、ねじれは、ねじれなしフレームからのねじれ角で表現する。
Simulating Knitted Cloth at the Yarn Level 編み物を糸一つ一つのレベルでシミュレーションする。高速化と安定化のため、通常のシミュレーションステップの外で、ゆがみの補正をshape matchingの方法で強制的に行う。
4-points Congruent Sets for Robust Surface Registration ２つのスキャンデータの位置あわせ。３点でのマッチングでなく、４点とその対角線の交点をうまく使う。
Structure-aware Halftoning 濃淡だけでなくテクスチャの類似性も評価する評価関数を用意して、ランダム探索で最適化する。
Lapped Solid Textures: Filling a Model with Anisotropic Textures キウイやにんじんのような中身のつまった３次元モデルを表現する。テンソル場にそってエレメントを配置する。
Green Coordinates FFDのように荒いケージを変形して中の画像や形状を変形するときに、頂点の座標だけでなく辺の法線方向も考慮した表現にすることで、局所的な角度の保存を実現する。
Shading-Based Surface Editing ３次元モデルのレンダリング結果の上に陰影を描き加えると、それに応じて３次元形状が変化する
Automatic Generation of Tourist Maps ３次元地図情報を与えると、自動的に手書きで作ったような重要なところだけを強調したわかりやすい地図が生成される。
Automated generation of interactive 3D exploded view diagrams エンジンのような複雑な３次元モデルの構造をわかりやすく説明するため、うまく分解したような図を生成する。
Interactive Visual Editing of Grammars for Procedural Architecture 生成規則によって建物を生成するシステムで、視覚的に局所的な編集ができるようにする。局所的変更の内容を一般化して保持しておき、ルールが変わったらあたらめて適用する。

08/7/10 アルゴリズムとデータ構造

昨年に出版したアルゴリズムとデータ構造の教科書のためのソースコードおよびデモプログラム集をつくったので公開してみました（こちら）。よくあるソースコードは、アルゴリズムの本質的な部分と、データ入出力やUIなどがごっちゃになっていたりするので、それをなるべくきれいにわけて、擬似コードに近い感じのソースコードだけみて勉強できるようにしてみました。あと、データ構造がただしく構築されているかがなかなかわからないので、データ構造の中身の様子を簡単に表示できるようなメソッドをあらかじめ用意しておきました。せっかく作ったのでたとえ少人数でもよいのでこれを使って勉強して「役に立った」と思ってくれる人がいるとよいのですが…。

08/6/5 高校生講座

東大の高校生のための金曜特別講座で話をしてきました。インターネットで日本各地の高校を結んだ遠隔講義でしたが、遠隔側でどのくらいちゃんと見えていたのか少し心配です。アンケート結果も見せてもらったのですが、「情報分野に興味をもった」というありがたいコメントの他に、「出来上がったもののデモだけでなく、作る過程・苦労も説明してもらえると、より勉強になるし、進路を選ぶ上でも参考になる」という意見がいくつかあり、なるほどなと思いました。質問でも、「このようなプログラムはどうかくのですか？」といったものがあり、きちんとわかりやすく説明する準備をしておいたほうがよいなと実感しました。おそらくBASICのようなバッチ形式のプログラムのことは知っていると思うのですが、インタラクティブなものは経験がないので結びつかないのだろうと推測されます。マウスの動きを受け取って画面に線を引く、といったあたりをうまく説明できるようなプレゼン資料をつくってみようと思いました。

08/5/21 SIGGRAPH Brochure

SIGGRAPHの広告に登場してます。「空を背景にしてなるべく明るい場所で写真とってね」といわれていたのですが、都内で空を背景にして取るのは難しく、天気も悪かったので暗めの写真になってしまいました。ちょっと残念。でも掲載されている一言は結構気に入ってます。

08/5/19 NASA

ワシントンDCのNASAで講演してきました。人工衛星を作ったり遠隔操作したりするところらしく、これから打ち上げる衛星や、それをテストする機械などを見せてもらいました。あと、NASAの成果を知らせるための画像を作っている Visualziation Studio でいろいろと映像を見せてもらいました。アイスランドの氷河が後退していく様子や台風の中での空気の動き、太陽の表面の磁場の様子のアニメーションなどなど。 Visualziation は科学研究のため（地球環境学者や天文学者の新たな発見のため）にやっているのかと思っていたのですが、 NASAの場合、主な業務は一般向けの広報活動用の映像作成だそうです。

08/4/21 Eurographics2008

ギリシャのクレタ島でした。乗り継ぎ２回のフライトで疲れました…。招待講演は一件が私で、もう一件はスタンフォードのLeonidas J. Guibasさんで、計算幾何学や生物情報・CGなどにおいて、離散的な構造を持つデータをどう扱うかという話でした。

Apparent Greyscale: A Simple and Fast Conversion to Perceptually Accurate Images and Video カラー画像をグレースケール画像に変換する。グローバルなマッピングとローカルなコントラストをはっきりさせる微調整を組み合わせる。
Sketching and Composing Widgets for 3D Manipulation ジェスチャーで３次元操作を行うためのウィジェットを出現させる。
Sketch-Based Procedural Surface Modeling and Compositing Using Surface Trees おおざっぱな３次元形状の表面上に、詳細な３次元形状のレイヤーを付け加えることによって階層的なモデリングを行う。
Floating Textures 複数カメラでの撮影による３次元ビデオにおいて、キャリブレーションエラーによるボケやゴーストを防ぐために、ランタイムに特徴点のマッチングをとる画像処理を行う。
An Example-based Procedural System for Element Arrangement 画面上に画像の要素（葉っぱや石粒、レンガなど）をいくつか並べるとそれをレイアウトのサンプルとして、大量の要素が生成される。
Conformal Flattening by Curvature Prescription and Metric Scaling ベストペーパー。３次元モデルの表面を２次元にパラメタライズするときに、まずcone singularityと呼ばれる特徴点を計算し、それらを通るようにメッシュを分割する。
Efficient and Dynamic Simplification of Line Drawings ベクター表現の画像（点列で表現されたペンストロークからなる画像）を縮小していったときに、混んでいる部分のストロークを適宜間引いていく。メッシュのレベルオブディティールと基本的に同じような方法。

08/3/31 パテントトロル

パテントトロルの話をきいてきました。自分達では製品をつくらず、特許をもとに大企業にライセンス料を要求することで稼ぐ会社です。なんでも、それをするためだけの会社がいっぱいあって、そこでは大量の投機的資金が投入されて、つぶれたベンチャー会社などの特許が買い集められているそうです。新聞などで話には聞いていましたが、われわれの業界（CGなど）でもまさに差し迫った問題になっているようです（パテントトロルではないですが、最近のSIGGRAPHで発表された某技術の特許が数億円で取引されたという話も聞きました）。で、それらに対抗する手段として、企業の研究所の重要性が増しているとのことです。すなわち、特許で将来訴えられないようにするには、相手より先に重要な特許をすべて抑えてしまえということです。昔は大企業の特許といえば、他の大企業との駆け引き（クロスライセンス）が主要な存在意義だったそうですが、今はそれがパテントトロルになってきているということのようです。我々研究者にとっては研究開発の重要性が増すというのは嬉しいことのような気がしますが、何も実業がなく買い漁った特許を振りかざしてお金をゆすりとる会社が栄えるというのはなんとも微妙な感じです。（しかもそれで儲かるのは技術者・研究者でなく弁護士・弁理士ばかりのような気がします）

08/3/26 くまぐる

←最近つくってたゲーム(くまぐる)。よかったら遊んでみてください。遊びすぎ注意。

08/3/1 ペン入力コミュニティ第２回セミナー

和歌山および岡山の教育現場においてタブレットＰＣを活用していらっしゃる先生方に講演していただきました。

小学館のドラゼミを使って漢字の練習や計算の練習を行う（個人での反復練習）。
OneNote を使ってノート取りをする。色を使えること、消せること、動かせることが重要。
ビデオや写真をとって、情報収集してプレゼンする練習をする。
DRAGRIを使って体育の授業をする。倒立の仕方などをじっくり学習できる。
ポートボールの作戦会議をタブレットＰＣで行う。

聞いていると準備が大変そうな気がしました。何かやるたびに、適切なソフト、素材を用意して、講義の流れを考えて準備する、というのは大変そうです。何かうまく教材集のアーカイブができるとよいと思いますが、すぐに膨大になってよいものを探すのが大変そうになりそうな気もします。個人的には、「作りこんだコンテンツよりも、適切に編集・加工できるコンテンツが欲しい」というコメントが聞けたのがよかったです。コンテンツの数をひたすら増やすよりも、ゼロから自分でコンテンツを作れるようにするほうが結果的に効率がよい、ということをうまく言えるとよいのですが。

08/2/29

SIGGRAPHの査読依頼を昔から世話になっている知り合いの研究者に出したら「もう研究職は辞めてしまったので査読も今後はしない」という返事がきました。少し前に、大学のテニュアが取れなくて辞めるという話を聞いていたので、予想された事態ではあったのですが、実際にすっぱり研究職を離れたと聞いてしまうとさびしいですね。今まで年に一回は学会であってましたし、査読やら学会運営やらで連絡があったのですが、今後それもなくなるということで、ある意味一生の別れのような気もします。以前にも、論文が通らないので研究はやめたという話もありましたがアメリカの研究業界というのはやはり厳しい世界というのを実感します。

08/2/7 修士論文

自分に関係ありそうなものだけ。

局所制御可能な演出トゥーンシェーダー: トゥーンシェーディングで、ブラシによるペイント操作で明るさを部分的に編集できるようにする。
人Piconotes: タグとファセット分類を用いた手書きメモ管理システム: 個人的なメモの管理にタグとファセットを使う
インタラクティブプログラムのための操作履歴視覚化手法操作履歴を表示するのにスナップショットにマウスの動きを表す注釈を加える。
To-doリストの再利用他人のリストや自分の過去のリストの内容から、追加すべき項目を自動提案する。
インタラクティブな結び目デザインシステム物理シミュレーションしながらスケッチで紐を結ぶ。
グラフィクスハードウェアを用いた自由表面を伴う流体シミュレーションの高速化ＧＰＵで流体シミュレーションする。粒子の追加と削除もＧＰＵでやるのがポイントらしい。
前景物体との重なり部における色合わせを考慮した画像合成法背景の上に絵を置いてからスライドすると、前景の後ろに「差し込まれる」。インタフェースが面白い。
アニメーションの彩色における分類ベースの領域マッチング領域の対応をとって自動的に彩色する。これも連鎖構造を提示するインタフェースがポイント。

08/1/1 謹賀新年

あけましておめでとうございます。今年の年末年始はずっと3次元キウイを作っておりました。皆さん、キウイの種の3次元配置がどうなってるか知ってますか？

07/12/28 ものづくり革命

「ものづくり革命 -パーソナルファブリケーションの幕開け- 」という本を読みました。パーソナルコンピュータの次は、個人が自分専用のモノを設計してつくるパーソナルファブリケーションの時代がくるという話。実際に筆者がMITのプロジェクトでやっていることは、個人で使えるレーザーカッターやフライス盤、マイクロコントローラをプログラミングするツールなどをそろえたファブラブという工作室を MIT内部およびインドやノルウェイなど世界各国に作って、現地の人々が自分の生活に必要なモノを自分で作れるようにしてみた、といった内容である。作ったモノの例は、

自分の叫び声を録音して再生する袋
人が近づくとトゲを出す衣服
オウムがＰＣを使うためのインタフェース
自分がデザインした自転車
合板を組み合わせた住宅
ネットワーク機能がビルトインされた建材
牛乳の土壌の成分を調べるセンサー
放牧された羊の居場所を調べるセンサネットワーク
美術館におくブラウザのための物理インタフェース

などなど。やっていることは、phydgetsやtangible bits のプロジェクトと似通っている気がするが、世界各地で現地の人とモノをつくっているところにインパクトを感じる。本のそれ以外の部分では、コンピュータの発明の歴史、工作機器やマイクロコントローラの原理の説明、コンピュータを発展途上国や紛争地域に持ち込んだ例、未来の話として自己増殖マシンの話（ノイマンのセルオートマタ、リボソームによるたんぱく質構築）などが紹介されている。個人的には、これらの仕事をどう研究にしてどこに発表しているかが気になる。SIGGRAPHとかCHIとかICRAとかもあるが、 Scientific American とかScienceとかにも発表しているらしい。

07/12/5 講演

最近は専門分野の講演よりも関係ない講演の方が面白いです。最近聞いた講演から。

トヨタの見える化: 工場における異常事態および非効率性を目に見えるようにする。カンバン方式＝部品と一緒にカンバンが製造工程を流れる。詰まると看板が溜まるので見える。アンドン＝何か異常があるとランプが光って監督者や管理者がすぐわかる。
教育番組の作り方: 家で一人で見る番組は、番組だけみて「理解させる」ように作る。学校で授業中に先生の指導で見る番組は、番組をみて「興味・意欲がわく」ように作る。実際に教えるのは先生。小学校低学年の番組は、ぬいぐるみや人形が主人公で、視聴者に語りかけたりせず、また架空のお話の世界に閉じてストーリーが展開する。小学校中高学年になると、人間がでてきて、視聴者に語りかけたり、現実の社会とリンクさせながら番組が進行する。

07/12/4 ERATO

新しくプロジェクトを始めることになり研究員および学生アルバイトを合計１０名ほど募集しております。研究者でなくとも、あたらしい技術を開発したい方であれば広く受け入れたいと考えています。興味のある方はこちらをご覧ください。

07/10/12 UIST 2007

今年は２０周年記念でいろいろ企画がありました。

The Re:Search Engine: Simultaneous Support for Finding and Re-Finding 一度検索したキーワードでもう一回検索したときに、結果が変わってしまうと困る。でも新しい結果もみたい。ので、前回の結果のうち重要なもの（ユーザがクリックしたもの）と新しい結果をうまく混ぜて提示する。
Eyepatch: Prototyping Camera-based Interaction through Examples カメラ（画像認識）を利用したアプリケーションを簡単に作れるようにする。よくつかうモジュールを用意しておき、その場でトレーニングできるようなインタフェースを提供する。
Hybrid Infrared and Visible Light Projection for Location Tracking １台のプロジェクタから可視光と赤外線を同時に映す。赤外線にはコードを埋め込んでスクリーン内での座標が取れるようにしておくと、映されたほうに埋め込んである光センサーの場所がわかる。
Socially Augmenting Employee Profiles with People-tagging 自己紹介をみんなちゃんと書いてくれないので、他人が書き込めるようにする。
Rethinking the Progress Bar いろいろな進み方のプログレスバーを比較してどれが一番短く感じられるかを調べた。途中で止まるのは最悪。はじめ遅くて、あとから加速するのが短く感じられる。
Bubble Clusters: An Interface for Manipulating Spatial Aggregation of Graphical Objects デスクトップのようにアイコンが並んでいるような状況で、近くに配置してあるものを自動的にグループ化してバブルで囲んで提示する。ユーザはバブルを掴むことでグループまとめて削除したり移動したりできる。
Boomerang: Suspendable Drag-and-Drop Interactions Based on a Throw-and-Catch Metaphor ドラッグアンドドロップの途中でアイコンを投げると中断できる。中断している間にスクロールしたりフォルダを開いたりできる。
Gui Phooey: The Case for Text Input PC上で簡単にテキストのメモを取れるようにする。同時にデスクトップの様子やカメラ画像などのコンテクスト情報も取り込むことであとから探しやすくする。自動的に意味抽出して他のアプリケーション（スケジュール帳など）にデータを取り込んでくれる。(pidgin)
ShapeShift: A Projector-Guided Sculpture System プロジェクターで彫刻の彫り方を指示する（ポスター）。去年の、プロジェクターで油絵の描き方を指示するシステムの続き。

07/8/12 SIGGRAPH 2007

今年は論文の数が至上最高数で、すべて追いきれてません。一応把握している範囲で重要そうなのを列挙します。

Solid Texture Synthesis from 2D Exemplars: 2Dのテクスチャから3Dのテキスチャを作る。ノイズから始めて３方向を見ながら最適化する。またグローバルなヒストグラムマッチングも行う。
Scene Completion Using Millions of Photographs 画像の穴を埋めるのにちょうどよい画像を大量の画像データベースから探してくる。
Near-optimal Character Animation with Continuous Control モーションキャプチャデータを使ってキャラクタをリモコンで操作する。どういう条件の時にどういう動きをすべきかを表現したテーブルを、少数の基底関数で表現し、先々まで考えて最適な動きを生成する。
Soft Scissors: An Interactive Tool for Realtime High Quality Matting マッティングをする際に前景を背景から切り出すためのインタフェース。ユーザが輪郭を太いブラシでなぞると、動的に切り出しを行う。
Many-Worlds Browsing for Control of Multibody Dynamics 物理シミュレーションで望みの結果を得るために、少しずつパラメータを変えた大量のシミュレーションを走らせてそこからうまくいったものをユーザが選ぶようにする。
Locally Controllable Stylized Shading トゥーンシェーディングで、ブラシによるペイント操作で明るさを部分的に編集できるようにする。
Line Drawings Via Abstracted Shading 明るさをレンダリングした結果に対してローカルに多項式をフィッティングして稜線と谷線を見つける。ＧＰＵで動く。
Apparent Ridges for Line Drawing 線画を描くときには、曲率が極値をとるところ（稜線と谷線）に線を描けばよいが、従来は３次元オブジェクト表面に沿った微分(?)を使っていた。この論文では、画面方向に沿った微分による極値を利用することを提案している。
Dynamic Planar Map Illustration 2Dのベクタードローソフトで、線で囲まれた領域をフィルしたあと、線を動かした時にフィルを自動的にアップデートする。中身はヒューリスティクスの塊。 Illustrator の LivePaint として実装されている。
Interactive cutaway illustrations of complex 3D models 複雑な内部構造をもった３次元モデルの構造を可視化する手法。見たい対象を遮蔽しているパーツをあらかじめ定義された切り取り方にしたがって消去する。
Digital Bas-Relief From 3D Scenes ３次元シーンを2.5Ｄの木彫として表現する。やっていることは深さ方向の圧縮であり、 HDR->LDRに使うトーンマップの手法を応用している。
Prakash: Lighting-Aware Motion Capture Using Photosensing Markers and Multiplexed Illumination コード化された光をプロジェクタで投射し、その中で小さい光センサーを埋め込んだ服をきて動くことでモーションキャプチャを行う。光センサーはプロジェクタの投影画面内での位置がわかるようになっている。
FiberMesh: Designing Freeform Surfaces with 3D Curves スケッチで３次元モデリングする。スケッチした曲線はオブジェクト表面に残るので、それを掴んで引っ張ることで変形を行うことができる。曲線は自由に足したり消したりでき、サーフェスは曲率最小曲面として自動的に生成される。
Interactive Topology-aware Surface Reconstruction ３次元スキャナでスキャンしたときに、トポロジーエラーが起きそうなところをユーザに知らせて、簡単なペイント操作でトポロジーを指定できるようにする。
ShapePalettes: Interactive Normal Transfer Via Sketching 2.5Dの絵を描くときに、サンプルとなる法線マップの上とターゲットとなる絵の上に線を描くと、対応する法線がコピーされる。
Plushie: An Interactive Design System for Plush Toys スケッチ操作で３Ｄモデリングすると自動的にぬいぐるみをつくるための２Ｄの型紙ができる。
Design of Tangent Vector Fields ３次元表面上のベクターフィールドを補間で作成する。ベクターフィールドは、エッジ毎に割り当てたスカラー値で表現する。
Isosurface Stuffing: Fast Tetrahedral Meshes with Good Dihedral Angles ３次元サーフェスモデル中に４面体メッシュを生成する方法。４面体の質（角度の下限と上限）を保証している。
Symmetrization ３次元物体が与えられたら全体を左右対称に調整する。部分的な対象性をハフ変換に似た方法で検出し、そのクラスタリングを繰り返すことで対称化する。
Harmonic Coordinates for Character Articulation ケージの変形でキャラクタの変形を制御する際に、ケージの各頂点からの影響の大きさを計算する手法。空間を離散化して方程式を解くことで滑らかな変形を実現する重みを得る。
Real-Time Enveloping with Rotational Regression メッシュのボーンによる変形。ボーンの姿勢からメッシュのローカルな「回転」を計算し、それらを組み上げることで全体の姿勢を得る。
Embedded Deformation for Shape Manipulation 対象３Ｄオブジェクト表面上にサンプルポイントをばら撒き、それらをエッジで結ぶ。サンプルポイント毎に回転量、移動量を定義し、その値をエッジでつながったもの同士が近くなるように最小二乗法で得る。
FastLSM: Fast Lattice Shape Matching for Robust Real-Time Deformation ３次元モデルを立方体格子で表現しデフォーメーションを実現する。個々の頂点をまず独立に物理法則にしたがって動かし、その後近傍立体格子群毎に形を復元する力をかける。同じ計算が何度もでてくるのでそれらを無駄なく行うことで高速な計算を実現する。
Simulating Biped Behaviors From Human Motion Data モーションキャプチャデータを元にロボットを動かす手法。そのまま使うと、物理的に安定しないので、調整を行う。普通は、データはいじらずに、実行時にダイナミクスを考慮した調整を行う。ここでは、シミュレーションで転倒が起きるたびにデータの方を修正することを繰り返し、「絶対に転倒がおきない」データベースを作成する。

他にも、３次元モデルに自動的にボーンを埋め込んでアニメーションさせるのとか、写真＋スケッチで木の３次元モデルを作る手法とか、写真の中身を考慮して拡大縮小する手法とかがありました。

07/7/29 ワークショップ

子供アート教室ということで、開発中のアニメーションソフト(MovingSketch) を子供達に使ってもらってアニメーションを作るワークショップにいってきました。作品をここに置いたのでよかったら見てみてください。落書きするような感覚でアニメーションを作るという当初の目的が達成できたのではないかと思っています。ただ、バグで何度も作りかけのアニメーションが消えてしまったようで子供達には申し訳なかったです。

07/7/10 ダンスダンスダンス

下記のようなアニメーションを作れるアプレットを公開しました。ここ。遊んでみてください。遊びすぎ注意。
今のところ保存はできません。ムービーにしたいかたは画面録画ソフト(e.g. camtasia)など使ってください。

07/7/6 今日の作品

音楽と同期して動きを録画できるようにしてみました。楽しすぎる…。