研究者紹介システム

田中 直樹
タナカ ナオキ
大学院海事科学研究科 海事科学専攻
教授
電気通信工学関係
Last Updated :2022/09/16

研究者情報

所属

  • 【主配置】

    大学院海事科学研究科 海事科学専攻
  • 【配置】

    海洋政策科学部 海洋政策科学科, 海事科学部 グローバル輸送科学科

学位

  • 工学博士, 大阪大学

授業科目

ジャンル

  • 情報・通信・メディア / 画像・音声認識

コメントテーマ

  • 画像処理
  • パターン認識
  • 文字列抽出
  • 手書き漢字認識
  • レーダー映像のターゲット抽出

研究活動

研究キーワード

  • 情報処理
  • 画像処理
  • パターン認識

研究分野

  • 情報通信 / 知能ロボティクス
  • 情報通信 / 知覚情報処理

論文

  • 岡 本 章 裕, 中 田 裕 一, 田中 直樹, 廣野 康平

    レーダ映像から高効率に情報を得る手法として,反射エコーの形状特徴とその動きに基づきターゲットを抽出する方法を提案する.反射エコー強度に基づき抽出する従来法とは異なり,ターゲットは時空間的に安定した孤立領域であるという知識に基づいて抽出を行う.モルフォロジー演算による孤立陰影抽出フィルタ及び領域分割により,荒天時などクラッタ(雑音)が発生しやすい場合や小型船などの反射エコーが弱いターゲットを含む場合にも対応でき,橋梁や防波堤に分断される領域からも抽出が可能となった.人工構造物やクラッタを含むレーダ映像からデータセットを作成し,抽出実験を行った結果,従来法と比べ抽出漏れ・過剰抽出を大幅に軽減する特性が示された.

    画像電子学会, 2016年01月, 画像電子学会学会誌, 45 (1), 112 - 117, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • 岡本 章裕, 吉田 大海, 田中 直樹, 廣野 康平

    喫水検査(Draught Survey)により穀物、鉱石、石炭、塩などのばら積み貨物の取引量を決定することは国際的な商習慣となっている。これは、利害関係の対立する荷主と運送人のもとで検査員(Surveyor)が公正な第三者として喫水を読み取るもので、両者の合意が得られない場合その後の運航に遅延を引き起こしかねない重要なプロセスである。
    現在、船舶の喫水読み取りは、航海士や検査員が目視で行うのが主流である。しかし荒天時は、うねりによる船体動揺や海面の上下動が強くなり、正確な読み取りが困難、かつ落水などの危険が伴う。そのような課題に対応するため喫水検定装置が考案されているが、大掛かりな装置が必要であることに加え、読み取りの判断自体は熟練の検査員が行う必要がある。
    喫水自動読取方式の確立は、喫水検査業務において客観的な指標を得る一つの手段と成り得る。それに

    日本航海学会, 2014年07月, 日本航海学会論文集, Vol.130, 135 - 140, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • エッジ極大点周辺の輝度分布を用いた低解像度における赤外画像からの瞳孔輪郭抽出 (パターン認識・メディア理解)

    中田 裕一, 田中 直樹, 長松 隆

    視線検出アルゴリズムには瞳孔中心の位置推定を含むものが多い.しかし瞳孔輪郭付近には目蓋や角膜反射など推定の妨げとなるオブジェクトが複数存在し,特に低解像度下においてはその影響が顕著である.本研究では赤外線カメラによる低解像度眼部画像について,極座標変換とエッジ周辺領域の特徴記述を用いて瞳孔輪郭の誤検出を抑制する手法を考案し,その性質について検討を行った.

    一般社団法人電子情報通信学会, 2014年06月19日, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 114 (90), 55 - 60, 日本語

    研究論文(研究会,シンポジウム資料等)

  • A Binarization Method for Degraded Document Images with Morphological Operations

    OKAMOTO AKIHIRO, TANAKA NAOKI

    In this paper, we propose an effective binarization
    method for de-graded document images in this paper.
    This method employs morphological operations
    throughout its algorithm to suppress uneven illumination
    in the background region, to detect the character
    location and to reconstruct text regions. Moreover, a
    technique for estimating stroke width of characters is
    introduced to r

    2013年05月, Proceeding of IAPR INTERNATIONAL CONFERENCE ON, 294 - 297, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Location-dependent Content-based Image Retrieval System Based on a P2P Mobile Agent Framework

    Yusuke Ariyoshi, Junzo Kamahara, Naoki Tanaka, Katsutoshi Hirayama, Takashi Nagamatsu, Yuuichi Teranishi

    In this article, we propose a geoconscious contentbased image retrieval system based on a P2P mobile agent framework. This system retrieves similar photographs from an image database of location- dependent photographs (e. g., photos of buildings, landmarks, etc.), which use GPS positions for geo-tagging. The P2P mobile agent framework supports intelligent agents. This agent searches similar content image using a query photograph by traversing the P2P network, instead of the mobile device issuing the query. In this paper, we describe the design of the proposed system and a portion of its implementation. This prototype system produces a new peer and rearranges the placement of image agents among peers for workload balancing. Furthermore, we provide the experimental results of our implementation for managing location-dependent image agents, which are clustered with peers in a distributed Delaunay network.

    IEEE, 2013年, 2013 IEEE INTERNATIONAL CONFERENCE ON PERVASIVE COMPUTING AND COMMUNICATIONS WORKSHOPS (PERCOM WORKSHOPS), 72 - 77, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Takashi Nagamatsu, Yukina Iwamoto, Ryuichi Sugano, Junzo Kamahara, Naoki Tanaka, Michiya Yamamoto

    We have proposed a novel geometric model of the eye in order to avoid the problems faced while using the conventional spherical model of the cornea for three dimensional (3D) model-based gaze estimation. The proposed model models the eye, including the boundary region of the cornea, as a general surface of revolution about the optical axis of the eye. Furthermore, a method for calculating the point of gaze (POG) on the basis of our model has been proposed. A prototype system for estimating the POG was developed using this method. The average root mean square errors (RMSEs) of the proposed method were experimentally found to be smaller than those of the gaze estimation method that is based on a spherical model of the cornea.

    IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2012年06月, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E95D (6), 1656 - 1667, 英語

    [査読有り]

    研究論文(学術雑誌)

  • A New Method of Character Strings Extraction based on Blanket Binarization

    YOSHIDA Hiromi, TANAKA Naoki, NAGAMATSU Takashi

    2012年03月, 10th IAPR International Workshop on Document Analysis Systems (DAS 2012), 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Junzo Kamahara, Naoki Tanaka, Katsutoshi Hirayama, Takashi Nagamatsu, Yuuichi Teranishi, Yusuke Ariyoshi

    In this article, we focus on the design of an agent-based P2P system for 'geoconscious' image retrieval. This system constitutes intelligent agents on the structured P2P framework PIAX (P2P Interactive Agent eXtension), which is especially enhanced for location-oriented services. In our design, a cluster agent manages the geometric area for image agents as a Voronoi region. We show some results from the implementation of our system and check the splitting of the Voronoi region using a test algorithm, thus confirming the behavior of our cluster agent.

    IEEE COMPUTER SOC, 2012年, 2012 SEVENTH INTERNATIONAL CONFERENCE ON BROADBAND, WIRELESS COMPUTING, COMMUNICATION AND APPLICATIONS (BWCCA 2012), 82 - 87, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Junzo Kamahara, Takashi Nagamatsu, Naoki Tanaka

    Nowadays, an enormous number of photographic images are uploaded on the Internet by casual users. In this study, we consider the concept of embedding geographical identification of locations as geotags in images. We attempt to retrieve images having certain similarities (or identical objects) from a geotagged image dataset. We then define the images having identical objects as orthologous images. Using content-based image retrieval (CBIR), we propose a ranking function - orthologous identity function (OIF) - to estimate the degree to which two images contain similarities in the form of identical objects; OIF is a similarity rating function that uses the geographic distance and image distance of photographs. Further, we evaluate the OIF as a ranking function by calculating the mean reciprocal rank (MRR) using our experimental dataset. The results reveal that the OIF can improve the efficiency of retrieving orthologous images as compared to using only geographic distance or image distance. Copyright 2012 ACM.

    2012年, GeoMM 2012 - Proceedings of the 2012 ACM International Workshop on Geotagging and Its Applications in Multimedia, Co-located with ACM Multimedia 2012, 9 - 14, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Takashi Nagamatsu, Ryuichi Sugano, Yukina Iwamoto, Junzo Kamahara, Naoki Tanaka

    This paper presents a user-calibration-free method for estimating the point of gaze (POG). This method provides a fast and stable solution for realizing user-calibration-free gaze estimation more accurately than the conventional method that uses the optical axis of the eye as an approximation of the visual axis of the eye. The optical axis of the eye can be estimated by using two cameras and two light sources. This estimation is carried out by using a spherical model of the cornea. The point of intersection of the optical axis of the eye with the object that the user gazes at is termed POA. On the basis of an assumption that the visual axes of both eyes intersect on the object, the POG is approximately estimated using the binocular 3D eye model as the midpoint of the line joining the POAs of both eyes. Based on this method, we have developed a prototype system that comprises a 19 '' display with two pairs of stereo cameras. We evaluated the system experimentally with 20 subjects who were at a distance of 600 mm from the display. The root-mean-square error (RMSE) of measurement of POG in the display screen coordinate system is 1.58 degrees.

    IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2011年09月, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E94D (9), 1817 - 1829, 英語

    [査読有り]

    研究論文(学術雑誌)

  • A Blanket Binarization Method for Character String Extraction

    YOSHIDA Hiromi, TANAKA Naoki

    2011年06月, Proceeding of the IAPR Conference on Machine Vision Applications 2011, MVA2011, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • 音声帯域の漁業無線を用いたデータ伝送に適した実況天気図の圧縮・復元方式の改良

    吉田 大海, 植村 博之, 田中 直樹, 井上 健

    2011年03月, 日本航海学会論文集, 124号 pp.345-353, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • ブランケット法を用いた文字列抽出に適した情景画像の2値化法

    吉田 大海, 田中 直樹

    2010年07月, 画像電子学会誌, Vol.39 No.4 pp.463-472, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • Hilditch細線化アルゴリズムにおける連結性保存条件の誤用に関する注意喚起

    吉田 大海, 田中 直樹, 井上 健

    2010年07月, 画像電子学会誌, Vol.39 No.4 pp.489-493, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • リスティングの法則に基づく眼球の視軸と光軸の回転モデルとそれを利用した視線推定手法と評価手法(マルチメディア処理)

    長松 隆, 鎌原 淳三, 田中 直樹

    社団法人電子情報通信学会, 2010年04月01日, 電子情報通信学会論文誌. D, 情報・システム, 93 (4), 511 - 521, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • 吉田 大海, 田中 直樹, 井上 健

    Transmitting a weather chart on a fisheries radio voice band, data size of a chart must be less than 3KB in order to keep the required time of a few minutes. Since it has over 340KB data size originally, we need to reduce the size by one hundredth. With conventional method, e.g. FAX format, 11KB is the best compressed size. In this paper we propose a new compression method for weather chart which achieves 3KB of compressed size with a fine quality of output image.

    公益社団法人 日本航海学会, 2010年03月, 日本航海学会論文集, 112号・pp.61-67, 61 - 67, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • Hiromi Yoshida, Naoki Tanaka

    We propose a new global binarization method suited for character strings extraction from a scene image. To obtain a high-quality segmentation result, binarization is a significant step in character extraction process. Since character strings region of sign board has the wide variety of layout and color, it is hard to binarize this category of images by conventional global methods, which are based on statistical information. The proposed method can select a threshold by evaluating the fineness of the binarized image by using the fractal dimension. By evaluating the compactness and stability of the regions of binarized image with the fractal dimension calculated by blanket method, the proposed method achieves fine binarzation results, which are no way inferior to manually and/or using one of promising global methods known as Otsu binarizing method. © 2010, The Institute of Image Electronics Engineers of Japan. All rights reserved.

    The Institute of Image Electrtonics Engineers of Japan, 2010年, Journal of the Institute of Image Electronics Engineers of Japan, 39 (4), 463 - 472, 英語

    [査読有り]

    研究論文(学術雑誌)

  • Takashi Nagamatsu, Ryuichi Sugano, Yukina Iwamoto, Junzo Kamahara, Naoki Tanaka

    This paper presents a user-calibration-free method for estimating the point of gaze (POG) on a display accurately with estimation of the horizontal angles between the visual and the optical axes of both eyes. By using one pair of cameras and two light sources, the optical axis of the eye can be estimated. This estimation is carried out by using a spherical model of the cornea. The point of intersection of the optical axis of the eye with the display is termed POA. By detecting the POAs of both the eyes, the POG is approximately estimated as the midpoint of the line joining the POAs of both the eyes on the basis of the binocular eye model; therefore, we can estimate the horizontal angles between the visual and the optical axes of both the eyes without requiring user calibration. We have developed a prototype system based on this method using a 19" display with two pairs of stereo cameras. We evaluated the system experimentally with 20 subjects who were at a distance of 600 mm from the display. The result shows that the average of the root-mean-square error (RMSE) of measurement of POG in the display screen coordinate system is 16.55 mm (equivalent to less than 1.58°). © 2010 ACM.

    2010年, Eye Tracking Research and Applications Symposium (ETRA), pp.251-254, 251 - 254, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Takashi Nagamatsu, Yukina Iwamoto, Junzo Kamahara, Naoki Tanaka, Michiya Yamamoto

    A novel gaze estimation method based on a novel aspherical model of the cornea is proposed in this paper. The model is a surface of revolution about the optical axis of the eye. The calculation method is explained on the basis of the model. A prototype system for estimating the point of gaze (POG) has been developed using this method. The proposed method has been found to be more accurate than the gaze estimation method based on a spherical model of the cornea. © 2010 ACM.

    2010年, Eye Tracking Research and Applications Symposium (ETRA), pp.255-258, 255 - 258, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • A Binarization Method for Crack Detection in a Road Surface Image with the Fractal Dimension

    YOSHIDA Hiromi, TANAKA Naoki

    2009年03月, Proceedings of IAPR Conference on Machine Vision Apprication 2010, pp.70-73, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • A New Binarization Method for a Sign Board Image with the Blanket Method

    Hiromi Yoshida, Naoki Tanaka

    We propose a new binarization method suited for character extraction from a sign board in a scenery image. The binarization is one of a significant step in character extraction in order to get high quality result. Character region on sigh board, however, has many variation and colors. In addition to it, if there exists high frequency texture region like a mountain or trees in the background, it can be a cause of difficulty to binarize an image. At the high frequency region, the binarized result is sensitive to the threshold value. On the other hand, a character region of sign board consists of solid area, that is, includes few high frequency regions, and has relatively high contrast. So the binarized result of character region is stable at an interval of the threshold value. Focusing attention on this point, we propose a new binarization method which obtains a threshold value based on the fractal dimension by evaluating both region's density and stability to threshold value. Through the proposed method, we can get a fine quality binarized images, where the characters can be extracted correctly.

    IEEE, 2009年, PROCEEDINGS OF THE 2009 CHINESE CONFERENCE ON PATTERN RECOGNITION AND THE FIRST CJK JOINT WORKSHOP ON PATTERN RECOGNITION, VOLS 1 AND 2, pp.845-848, 845 - 848, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • A Binarization Method for a Scenery Image with the Fractal Dimension

    Hiromi Yoshida, Naoki Tanaka

    We propose a new binarization method suited for character extraction from a sign board in a scenery image. The binarization is thought to be a significant step in character extraction in order to get high quality result. Character region of sigh board, however, has many variation and colors. In addition to it, if there exists high frequency texture region like a mountain or trees in the background, it can be a cause of difficulty to binarize an image. At the high frequency region, the binarized result is sensitive to the threshold change. On the other hand, a character region of sign board consists of solid area, that is, includes few high frequency regions, and has relatively high contrast. So the binarized result of character region is stabile against an interval of the threshold value. Focusing attention on this point, we propose a new method which obtains a threshold value based on the fractal dimension to evaluate both region's density and stability to threshold change. Through the proposed method, we can get a fine quality binarized images, where the characters can be extracted correctly.

    SPRINGER-VERLAG BERLIN, 2009年, PROGRESS IN PATTERN RECOGNITION, IMAGE ANALYSIS, COMPUTER VISION, AND APPLICATIONS, PROCEEDINGS, 5856, 29 - 36, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Takashi Nagamatsu, Junzo Kamahara, Naoki Tanaka

    This paper presents a calibration-free method for estimating the point of gaze (POG) on a display by using two pairs of stereo cameras. By using one pair of cameras and two light sources, the optical axis of the eye and the position of the center of the cornea can be estimated. This estimation is carried out by using a spherical model of the cornea. One pair of cameras is used for the estimation of the optical axis of the left eye, and the other pair is used for the estimation of the optical axis of the right eye. The point of intersection of optical axis with the display is termed the point of the optical axis (POA). The POG is approximately estimated as the midpoint of the line joining POAs of both the eyes with the display. We have developed a prototype system based on this method and demonstrated that the midpoint of POAs was closer to the fiducial point that the user gazed at than each POA.

    2009年, Conference on Human Factors in Computing Systems - Proceedings, pp. 3613-3618, 3613 - 3618, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • 道路面管理のための劣化にロバストな白線検出手法

    田中 直樹

    本論文では,レーザ路面画像からの白線抽出方式を提案している.道路面管理において主要な路面要素の一つである白線領域の抽出が必要となり,その抽出方式は白線の劣化による切れやかすれに頑健であることが求められる.また,路面の荒れに起因する高ノイズ性,撮像に用いたレーザイメージング装置の低コントラスト性にも耐え得る必要がある.提案方式は,Jensen-Shannon divergenceを用いたエッジ抽出及びモフォロジーを用いたエッジ強調,ノイズ処理,領域抽出に基づいており,レーザ路面画像の低コントラスト性や白線のかすれなどに対応できる抽出を実現している.コマツエンジニアリングにより公開された319枚の路面画像データベースと新たに提供された路面画像7733枚(非公開)を用いた白線抽出実験を実施し,それぞれ約95%,98%の正抽出率を得ている.なお,レーザイメージング装置では,一部の黄線がやや暗い白線として観測されるため,それらも対象として抽出し,抽出後平均輝度値による白線・黄線の判別を試みている.

    一般社団法人電子情報通信学会, 2008年08月, 電子情報通信学会論文誌, 第91巻・第8号・pp.2129-2136 (8), 2129 - 2136, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • A Study on Signboard Image Identification with SIFT Features

    Yoshida Hiromi, Tanaka Naoki

    2008年08月, Hands out of 8th IAPR International Workshop on Document Analysis Systems, pp.10-13, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Yuming Wang, Naoki Tanaka

    Extraction of text from. scene image is much difficult than extraction from simple document image. A lot of researches succeeded in extracting single text string from image, but can not deal with image including many text strings. Meanwhile, the result may be mixed with noises be similar to text. This paper describes an algorithm that uses mathematical morphology to extract text effectively, and edge border ratio is utilized to differentiate text region from noise region, using the edge contrast feature of the text region in real scene. This paper also describes the method which can connect characters into text strings, and distribute text strings to different subimages according to their width of strokes. The algorithm is implied to scene image like signs, indicators as well as magazine covers, and its robustness is proved.

    IEEE COMPUTER SOC, 2008年, PROCEEDINGS OF THE 8TH IAPR INTERNATIONAL WORKSHOP ON DOCUMENT ANALYSIS SYSTEMS, pp.323-328, 323 - 328, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • 3D Gaze Tracking with Easy Calibration Using Stereo Cameras for Robot and Human Communication

    Takashi Nagamatsu, Junzo Kamahara, Naoki Tanaka

    This paper presents a method to estimate the optic and visual axes of an eye and the Point Of Gaze (POG) on the bases of Listing's law using stereo cameras for three-dimensional (3D) gaze tracking. By using two cameras and two light sources, the optic axis of the eye can be estimated on the basis of a spherical model of a cornea. A one-point calibration is required to estimate the angle of the visual axis from the optic axis. However, a real cornea has an aspheric shape and therefore it is difficult to estimate the POG in all the directions accurately. We have used three light sources to improve the estimation of the POG. Two light sources near the center of the pupil in the camera image are used for estimating the POG. The experimental results show that the accuracy of the estimation of the visual axis is under about 1 degrees.

    IEEE, 2008年, 2008 17TH IEEE INTERNATIONAL SYMPOSIUM ON ROBOT AND HUMAN INTERACTIVE COMMUNICATION, VOLS 1 AND 2, pp. 59-64, 59 - 64, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • Takashi Nagamatsu, Junzo Kamahara, Takumi Iko, Naoki Tanaka

    This paper presents a one-point calibration gaze tracking method based on eyeball kinematics using stereo cameras. By using two cameras and two light sources, the optic axis of the eye can be estimated. One-point calibration is required to estimate the angle of the visual axis from the optic axis. The eyeball rotates with optic and visual axes based on the eyeball kinematics (Listing's law). Therefore, we introduced eyeball kinematics to the one-point calibration process in order to properly estimate the visual axis. The prototype system was developed and it was found that the accuracy was under 1 degrees around the center and bottom of the display.

    ASSOC COMPUTING MACHINERY, 2008年, PROCEEDINGS OF THE EYE TRACKING RESEARCH AND APPLICATIONS SYMPOSIUM (ETRA 2008), pp.95-98, 95 - 98, 英語

    [査読有り]

    研究論文(国際会議プロシーディングス)

  • カテゴリ重複学習による多段BPネットワークの構成法

    田中 直樹, 梶谷 浩二

    2007年03月, 情報処理学会論文誌, 第48・第3号・1502-1511, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • レーザー画像を用いた路面からのクラック抽出

    田中 直樹

    2006年10月, 土木学会論文集E, Vol. 62 ・ No. 4・pp.631-640, 日本語

    [査読有り]

    研究論文(学術雑誌)

  • 有吉,勇介, 鎌原,淳三, 平山,勝敏, 田中,直樹, 長松,隆, 寺西,裕一

    尾道市立大学経済情報学部, 2013年12月28日, 尾道市立大学経済情報論集(2012年度以降), 13 (2), 167 - 181, 日本語

MISC

  • 認識・検出 舶用レーダにおける映像特徴に基づいたターゲット抽出方式

    田中 直樹, 岡本 章裕, 中田 裕一, 廣野 康平

    日本工業出版, 2017年09月, 画像ラボ, 28 (9), 21 - 28, 日本語

  • 解析・計測 両眼モデルを用いたユーザキャリブレーションフリー視線計測手法

    長松 隆, 鎌原 淳三, 田中 直樹

    日本工業出版, 2012年06月, 画像ラボ, 23 (6), 29 - 34, 日本語

  • 広範囲計測が可能なユーザキャリブレーションフリー視線計測装置の提案

    菅野 隆一, 長松 隆, 鎌原 淳三, 田中 直樹, 山本 倫也

    2011年09月, ヒューマンインタフェースシンポジウム2011 DVD-ROM論文集, 439 - 444

  • 角膜反射を用いた三次元視線計測手法--リスティングの法則に基づく眼球の光軸と視軸の回転モデルによる視線推定

    長松 隆, 鎌原 淳三, 田中 直樹

    日本工業出版, 2010年12月, 画像ラボ, 21 (12), 57 - 63, 日本語

    記事・総説・解説・論説等(商業誌、新聞、ウェブメディア)

  • 招待論文 ハードウエア・ロックステップ機構によるフォールトトレラント・コンピュータ--Windows FT コンピュータ ftServerの市場リリース報告

    田中 直樹

    ストラタスは1980年創業のフォールトトレラント・コンピュータ専業メーカー。そのストラタスが2001年から市場に投入しているWindows[○!R]ベースのFT機、ftServerの特徴と従来製品との違いや市場動向について説明します。ハードウエアによるロックステップ、2重化および3重化構成、フェイルセーフ・システムソフトウェア、そして高可用にフォーカスした保守のしくみと、導入事例なども合わせてご紹介いたします。

    一般社団法人電子情報通信学会, 2005年04月15日, 電子情報通信学会技術研究報告, 105 (3), 7 - 14, 日本語

  • 海上無線アドホック通信網におけるトラヒック・シェービングの効果

    長谷川 倫之, 井上 健, 田中 直樹

    漁船等の小型船舶に安価なデータ通信網を提供するために実用化が検討されている音声帯域の海上アドホック通信網のフレーム伝送性能について検討する.1,200bps程度の低速回線で構成された中継網の上でデータ通信を行うためには,網内負荷を適切に制御し,輻輳を防止することが重要であることがこれまでの検討から分かっている.本研究では,網内に入場するフレームの流れを平坦化するトラヒック・シェーピングを採用した場合の輻輳防止に対する有効性をシミュレーションによって検討している.その結果を元に網内でのフレームの転送状況を分析し,トラヒック・シェーピングの効果と問題点について述べる.

    一般社団法人電子情報通信学会, 2010年12月09日, 電子情報通信学会技術研究報告. NS, ネットワークシステム, 110 (339), 143 - 148, 日本語

  • PDPモデルによる手書き漢字認識に関する一検討

    田中 直樹, 梶谷 浩二

    近畿大学, 1989年09月, 近畿大学理工学部研究報告, 25, 289 - 295, 日本語

  • ステレオカメラを利用した1点キャリブレーションによる視線計測手法

    長松 隆, 鎌原 淳三, 伊香 拓真, 田中 直樹

    2008年03月13日, 全国大会講演論文集, 70, 7 - 8, 日本語

講演・口頭発表等

  • 深層学習と画像セグメンテーションに基づいた動物種類と位置の検出

    任 散陽, 中田裕一, 田中直樹

    情報処理学会総合大会, 2020年03月

  • 点字ブロック領域・種別識別による視覚障がい者支援システムに関する研究

    若松直人, 中田裕一, 田中直樹

    情報処理学会総合大会, 2020年03月

    口頭発表(一般)

  • 低品質新聞画像における多手法による適応的なOCR認識精度向上に関する研究

    小谷匡史, 中田祐一, 田中直樹

    電子情報通信学会総合大会, 2018年03月

    口頭発表(一般)

  • エッジ極大点周辺の輝度分布を用いた低解像度における赤外画像からの瞳孔輪郭抽出

    中田裕一, 田中 直樹, 長松 隆

    パターン認識・メディア理解研究会(PRMU), 2014年06月, 日本語, 国内会議

    口頭発表(一般)

  • 画像処理を用いた 計測距離にロバストな喫水自動読取方式

    岡本 章裕, 田中 直樹, 廣野 康平

    日本航海学会第128回講演会, 2013年11月, 日本語, 現在、船舶の喫水計測は、航海士やサーベイヤーが目視で読取を行うのが主流である。しかし荒天時は、 うねりによる船体動揺や海面の上下動が強くなり、そうした悪条件のもとでの喫水計測は困難かつ落水など の危険が伴うものである。そのため、非接触・高精度な喫水の自動読取方式が確立されることは、船舶の安 全運航および喫水検査業務を大きく支援するものと考えられる。また当該技術は、読取の客観的な指標を与 える一つの基準にも成り得るため、商業的な観点からも重要な意義があると考えられる。 本稿が提案する喫水読取方式は、動画撮影された喫水の映像から、画像処理によって喫水読取を行う方式 である。同方式は計測距離にロバストであるという特徴を持ち、さらには輝度や色の変化に対しても、一定 の頑健性を有している。そのため、様々な環境下での利用が期待できる。 また、本方式を構成する, 国内会議

    口頭発表(一般)

  • 位置情報付き類似画像を用いた未知画像のタグ推定における精度評価実験

    和多田 吉樹, 鎌原 淳三, 長松 隆, 田中 直樹

    第4回データ工学と情報マネジメントに関するフォーラム(deim2012), 2012年03月, 日本語, 国内会議

    口頭発表(一般)

  • 広範囲計測が可能なユーザキャリブレーションフリー視線計測装置の提案

    菅野 隆一, 長松 隆, 鎌原 淳三, 田中 直樹, 山本 倫也

    ヒューマンインタフェースシンポジウム2011, 2011年09月, 日本語, 国内会議

    口頭発表(一般)

  • 利用者によるキャリブレーションがいらない視線計測手法

    長松 隆, 鎌原 淳三, 田中 直樹

    第67回 ヒューマンインタフェース学会研究会, 2010年11月, 日本語, 国内会議

    口頭発表(一般)

  • 位置情報付き画像間の正規化距離を用いた建物特定のためのハイブリッド方式

    鎌原 淳三, 長松 隆, 田中 直樹

    Webとデータベースに関するフォーラム(WebDB Forum)2008, 2008年, 日本語, 国内会議

    口頭発表(一般)

  • ステレオカメラを利用した1点キャリブレーションによる視線計測手法

    長松 隆, 鎌原 淳三, 伊香 拓真, 田中 直樹

    情報処理学会第70回全国大会, 2008年, 日本語, 国内会議

    口頭発表(一般)

所属学協会

  • 情報処理学会

  • 電子情報通信学会

  • 画像電子学会

共同研究・競争的資金等の研究課題

  • 田中 直樹

    日本学術振興会, 学術研究助成基金助成金/基盤研究(C), 基盤研究(C), 神戸大学, 2016年04月 - 2020年03月, 研究代表者

    視覚障がい者は、鉄道駅のプラットフォームからの転落事故の増加などが見られ、その安全性の確保や行動範囲を広げるための歩行支援が求められている。本研究課題では、ウエアラブルデバイスなどにより取得した情景画像から、案内看板などの文字列や、点字ブロックなど視覚障がい者の歩行支援オブジェクトの抽出やその種別の判別などに関する研究を実施した。低解像度文字列の強調方式、文字列領域抽出、点字ブロックの判別及び領域抽出方式の開発などの成果を達成している。

    競争的資金

  • 長松 隆

    日本学術振興会, 科学研究費補助金/基盤研究(B), 基盤研究(B), 神戸大学, 2016年04月 - 2020年03月

    視線を利用したヒューマンインタフェースの研究開発は、今後、急速に進展すると予想される。しかしながら、利用前にユーザが数点の注視を行う校正作業(キャリブレーション)が必要なままであり、応用範囲が限定される状況にあった。 本研究では、幾何学的な制約によるランタイムキャリブレーションについて研究し、その限界を示した。そのため新たな方法を検討した結果、画面情報を活用したランタイムキャリブレーション手法を提案した。画面情報としては、顕著性マップ、顔の領域抽出を利用した。その結果、顕著性マップより、顔の領域抽出を用いた場合で、精度よくキャリブレーションを行えることが示唆された。

    競争的資金

  • 長松 隆

    科学研究費補助金/基盤研究(B), 2011年

    競争的資金

  • 鎌原 淳三

    日本学術振興会, 科学研究費補助金/基盤研究(B), 基盤研究(B), 神戸大学, 2010年 - 2012年

    本研究課題はインターネット上に存在する位置情報付きの画像に関する情報を、位置に応じて分散エージェント上で管理するシステムの設計と開発を行った。各エージェントは管理している画像の特徴量を計算し、画像類似度と位置を用いて画像クラスタリングを行う。そして、(1)画像による検索要求に対して類似する画像クラスタを求め(2)その画像クラスタ中から要求された画像に類似した画像を結果として返す処理を分散環境において行う。

    競争的資金

  • 田中 直樹

    日本学術振興会, 科学研究費補助金/基盤研究(C), 基盤研究(C), 神戸大学, 2010年 - 2014年03月31日, 研究代表者

    道路面の管理のための路面観測システムの構築に関すす研究をおこなった。道路は、重要な社会インフラであるが総延長が100万kmともなりその管理は容易ではない。路面画像による道路観測の自動化には、一般に低コントラスト・高ノイズとなる路面画像への対応、路面性状の異なる排水性・非排水性路面への対応などが必要となる。さらに、クラックそのものが深さ、形状などが多様であり画像特性が一様でない困難さを伴う。本提案方式では、主にモルフォジィ演算などを活用し十分な実用性能を持つ検出性能を有してシステムの開発に成功している。

    競争的資金

  • モルフォロジィーを用いた路面画像からの路面要素の認識に関する研究

    田中 直樹, 前場 隆史, 堀口 知也, 平山 勝敏

    日本学術振興会, 科学研究費助成事業 基盤研究(C), 基盤研究(C), 2003年 - 2006年

    道路面のメンテナンスにおいて、路面に発生したクラックや、路面の構成要素である白線などを検出することが必要となる。本研究では、目視による路面状態の把握作業に実際使用されている路面画像を用い、クラック、白線、ジョイント、マンホールの領域を抽出することを目指している。路面画像におけるクラック・白線などは路面画像の低コントラスト性や路面の荒れによるかすれなどが抽出を難しくしている。本研究では、まずそれぞれの要素を単独に抽出する方式を提案し、それぞれに要素について十分な正抽出率を得ている。一方、各要素の単独抽出において、例えば、マンホールの周囲にできる溝をクラックとして抽出してしまうなど、他の要素が原因となる誤抽出が生じてしまうことが問題となった。各要素間には制約条件が存在するため、これらをルール化することによりこのような誤抽出を緩和することができる。これらの要素間に成り立つルールを抽出し、各要素間の競合の解消できる方式を構築した。また、大量の新たな路面画像データを路面観測の現場より入手し、それぞれの要素の抽出実験を行った。その結果、新たな画像データにはこれまでの画像データに含まれなかった種類の「しみ」が存在し、ヒビと誤認されて抽出されることが判明しその対策を行った。また、白センターライン・黄センターラインの抽出においても、抽出の基本となるジャンセン・シャノンダイバージェンスによる領域エッジ抽出方式に関してもパラメータの若干の調整が必要であることが判り、その調整作業を実施した。これらにより、新たな画像データに関しても安定した高精度な路面要素の抽出がほぼ可能となり、路面画像からの路面要素抽出はほぼ完成の域に達したと考えられる。

  • 画像からの文字・線図形の抽出・認識

    田中 直樹, 平山 勝敏, 前場 隆史

    日本学術振興会, 科学研究費助成事業 基盤研究(C), 基盤研究(C), 神戸商船大学, 1998年 - 2000年

    本研究の目標は,多様な画像に適用できる文字・線図形抽出方式を開発することにあった。文字抽出方式としては、1.雑誌表紙画像からの文字列抽出方式2.ニュース映像からのテロップ抽出方式を開発した。1の方式は、差分Top-hat演算による画像分割に基づいた方式であり、部分ヒストグラム法による2値化処理、抽出領域の競合解消処理などの部分に重点を置き研究を進めた。2の方式は、主にTop-hat変換などのモルフォロジィ演算に基づいてテロップフレームの検出と、テロップ領域の抽出を実現している。線図形としては、道路面の路面要素(ひび、白線、黄線、ジョイント)を対象として取り上げ、路面要素抽出方式を開発した。ひび抽出を例に取ると、ひびは形状が曖昧であり、背景部と低コントラストであることなどから従来方式では抽出が困難であったが、top-hat変換とヒストグラム変換処理による鞍上点の検出を新たに開発することによりひびの高精度の抽出を実現している。また,抽出対象としての画像データを収集・分析し画像データベースを構築も併せて行った。さらに,今回開発方式はいずれも主要な処理にモルフォロジィ演算を用いており、モルフォロジィ演算の逐次計算機での演算速度の遅さが処理時間の増大を招いている。これを解消すべく、モルフォロジィを並列計算機上に実装するうえでの検討を行った。また、抽出領域の競合解消のための制約充足問題に関する検討も併せて行った。