TOHOKU UNIVERSITY Researchers

Details of the Researcher

Home

日本語 English

Masami Akamine

Section

Tohoku University Advanced Graduate School

Job title

Professor

researchmap

https://researchmap.jp/makamine

J-GLOBAL ID

202601017025397134

e-Rad No.

91034700

Research History 14

2025/11 - Present

Tohoku University　Tohoku University Advanced Graduate School　Professor
2019/04 - 2025/10

Tohoku University　Graduate School of Engineering　Specially Appointed Professor
2018/04 - 2019/03

東芝研究開発センター・メディアAIラボラトリー　シニアフェロー
2016/04 - 2019/03

慶應義塾大学理工学研究科　非常勤特任教授
2015/04 - 2018/03

東芝リサーチ・コンサルティング　シニアフェロー
2005/04 - 2015/03

東芝研究開発センター　技監
2004/04 - 2005/03

東芝研究開発センター・特別研究室　研究主幹
2002/04 - 2004/03

東芝研究開発センター　研究企画室グループ長
2000/04 - 2002/03

東芝研究開発センター・マルチメディアラボラトリー　室長
2000/04 - 2001/03

和歌山大学大学院システム工学研究科　非常勤講師
1997/04 - 2000/03

東芝研究開発センター・関西研究所　ラボリーダー
1994/04 - 1997/03

東芝研究開発センター・情報通信システム研究所　主任研究員
1989/04 - 1994/03

東芝研究開発センター・情報通信システム研究所　研究主務
1985/04 - 1989/03

東芝総合研究所(平成4年から研究開発センターに改名)・電子機器研究所　研究員

Show all Show first 5

Education 2

Tohoku University　Graduate School of Engineering

1982/04 - 1985/03
Tohoku University

1980/04 - 1982/03

Professional Memberships 4

電子情報通信学会名誉員

2022/06 - Present
APSIPA (Asia Pacific Signal and Information Processing Association)

2008/01 - Present
ISCA (International Speech Communication Association)

2003/01 - Present
IEEE

1984/01 - 2023/12

Research Interests 6

Machine Learning
Digital Signal Processing
Spoken Dialog
Speech Coding
Automatic Speech Recognition
Speech Synthesis

Research Areas 1

Informatics / Human interfaces and interactions / Speech Processing

Awards 10

功績賞

2020/06　電子情報通信学会
紫綬褒章

2013/04　内閣府
業績賞

2012/05　電子情報通信学会
全国発明表彰内閣総理大臣発明賞

2008/06　発明協会
連作論文賞

2003/09　電子情報通信学会
市村産業賞功績賞

2003/04　新技術開発財団
技術開発賞

2002/05　日本音響学会
文部科学大臣賞研究功績者

2001/04　文部科学省
テレコムシステム技術賞

2001/03　電気通信普及財団
篠原記念学術奨励賞

1989/03　電子情報通信学会

Show all ︎Show 5

Papers 60

Dialog State Tracking for Unseen Values Using an Extended Attention Mechanism

Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

9TH INTERNATIONAL WORKSHOP ON SPOKEN DIALOGUE SYSTEM TECHNOLOGY　579　77-89　2019

DOI： 10.1007/978-981-13-9443-0_7 　

ISSN： 1876-1100

eISSN： 1876-1119
OUT-OF-DOMAIN SLOT VALUE DETECTION FOR SPOKEN DIALOGUE SYSTEMS WITH CONTEXT INFORMATION

Yuka Kobayashi, Takami Yoshida, Kenji Iwata, Hiroshi Fujimura, Masami Akamine

2018 IEEE WORKSHOP ON SPOKEN LANGUAGE TECHNOLOGY (SLT 2018)　854-861　2018

ISSN： 2639-5479
Near and Far Field Speech-in-Noise Intelligibility Improvements Based on a Time-Frequency Energy Reallocation Approach

Tudor-Catalin Zorila, Yannis Stylianou, Tatsuma Ishihara, Masami Akamine

IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING　24　(10)　1808-1818　2016/10

DOI： 10.1109/TASLP.2016.2585864 　

ISSN： 2329-9290

eISSN： 2329-9304
Statistical Bandwidth Extension for Speech Synthesis Based on Gaussian Mixture Model with Sub-Band Basis Spectrum Model

Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Masami Akamine

IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS　E99D　(10)　2481-2489　2016/10

DOI： 10.1587/transinf.2016SLP0006 　

ISSN： 1745-1361
Voice Activity Detection: Merging Source and Filter-based Information

Thomas Drugman, Yannis Stylianou, Yusuke Kida, Masami Akamine

IEEE SIGNAL PROCESSING LETTERS　23　(2)　252-256　2016/02

DOI： 10.1109/LSP.2015.2495219 　

ISSN： 1070-9908

eISSN： 1558-2361
Emotional transplant in statistical speech synthesis based on emotion additive model

Yaniato Ohtani, Yu Nasu, Masahiro Morita, Masami Akamine

16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5　274-278　2015
A Maximum Likelihood Approach to the Detection of Moments of Maximum Excitation and its Application to High-Quality Speech Parameterization

Ranniery Maia, Yannis Stylianou, Masami Akamine

16TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2015), VOLS 1-5　603-607　2015
On the impact of excitation and spectral parameters for expressive statistical parametric speech synthesis

Ranniery Maia, Masami Akamine

COMPUTER SPEECH AND LANGUAGE　28　(5)　1209-1232　2014/09

DOI： 10.1016/j.csl.2013.10.001 　

ISSN： 0885-2308

eISSN： 1095-8363
Building HMM-TTS Voices on Diverse Data

Vincent Wan, Javier Latorre, Kayoko Yanagisawa, Norbert Braunschweiler, Langzhou Chen, Mark J. F. Gales, Masami Akamine

IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING　8　(2)　296-306　2014/04

DOI： 10.1109/JSTSP.2013.2295058 　

ISSN： 1932-4553

eISSN： 1941-0484
Integrated Expression Prediction and Speech Synthesis From Text

Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

IEEE JOURNAL OF SELECTED TOPICS IN SIGNAL PROCESSING　8　(2)　323-335　2014/04

DOI： 10.1109/JSTSP.2013.2294938 　

ISSN： 1932-4553

eISSN： 1941-0484
Complex cepstrum for statistical parametric speech synthesis

Ranniery Maia, Masami Akamine, Mark J. F. Gales

SPEECH COMMUNICATION　55　(5)　606-618　2013/06

DOI： 10.1016/j.specom.2012.12.008 　

ISSN： 0167-6393

eISSN： 1872-7182
Minimum mean squared error based warped complex cepstrum analysis for statistical parametric speech synthesis

Ranniery Maia, Mark J. F. Gales, Yannis Stylianou, Masami Akamine

14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5　2335-2339　2013

ISSN： 2308-457X
Photo-Realistic Expressive Text to Talking Head Synthesis

Vincent Wan, Robert Anderson, Art Blokland, Norbert Braunschweiler, Langzhou Chen, BalaKrishna Kolluru, Javier Latorre, Ranniery Maia, Bjoern Stenger, Kayoko Yanagisawa, Yannis Stylianou, Masami Akamine, Mark J. F. Gales, Roberto Cipolla

14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5　2666-2668　2013

ISSN： 2308-457X
TRAINING A SUPRA-SEGMENTAL PARAMETRIC F0 MODEL WITHOUT INTERPOLATING F0

Javier Latorre, Mark J. F. Gales, Kate Knill, Masami Akamine

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　6880-6884　2013

ISSN： 1520-6149
COMPLEX CEPSTRUM ANALYSIS BASED ON THE MINIMUM MEAN SQUARED ERROR

Ranniery Maia, Masami Akamine, M. J. F. Gales

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　7972-7976　2013

ISSN： 1520-6149
INTEGRATED AUTOMATIC EXPRESSION PREDICTION AND SPEECH SYNTHESIS FROM TEXT

Langzhou Chen, Mark J. F. Gales, Norbert Braunschweiler, Masami Akamine, Kate Knill

2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　7977-7981　2013

ISSN： 1520-6149
Decision tree-based acoustic models for speech recognition

Masami Akamine, Jitendra Ajmera

EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING　2012

DOI： 10.1186/1687-4722-2012-10 　

ISSN： 1687-4722
COMPLEX CEPSTRUM AS PHASE INFORMATION IN STATISTICAL PARAMETRIC SPEECH SYNTHESIS

Ranniery Maia, Masami Akamine, M. J. F. Gales

2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)　4581-4584　2012

ISSN： 1520-6149
Exploring Rich Expressive Information from Audiobook Data Using Cluster Adaptive Training

Langzhou Chen, Mark J. F. Gales, Vincent Wan, Javier Latorre, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　958-961　2012
Speech factorization for HMM-TTS based on cluster adaptive training.

Javier Latorre, Vincent Wan, Mark J. F. Gales, Langzhou Chen, K. K. Chin, Kate Knill, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　970-973　2012
Combining multiple high quality corpora for improving HMM-TTS

Vincent Wan, Javier Latorre, K. K. Chin, Langzhou Chen, Mark J. F. Gales, Heiga Zen, Kate Knill, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1134-1137　2012
Histogram-based spectral equalization for HMM-based speech synthesis using mel-LSP

Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1154-1157　2012
HMM-based speech synthesis using sub-band basis spectrum model

Yamato Ohtani, Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1438-1441　2012
Analysis on the Importance of Short-Term Speech Parameterizations for Emotional Statistical Parametric Speech Synthesis

Ranniery Maia, Masami Akamine

13TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2012 (INTERSPEECH 2012), VOLS 1-3　1630-1633　2012
Decision Tree-Based Acoustic Models for Speech Recognition with Improved Smoothness

Masami Akamine, Jitendra Ajmera

IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS　E94D　(11)　2250-2258　2011/11

DOI： 10.1587/transinf.E94.D.2250 　

ISSN： 1745-1361
CONTINUOUS F0 IN THE SOURCE-EXCITATION GENERATION FOR HMM-BASED TTS: DO WE NEED VOICEDIUNVOICED CLASSIFICATION?

Javier Latorre, Mark J. F. Gales, Sabine Buchholz, Kate Knill, Masatsune Tamura, Yamato Ohtani, Masami Akamine

2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　4724-4727　2011

ISSN： 1520-6149
ONE SENTENCE VOICE ADAPTATION USING GMM-BASED FREQUENCY-WARPING AND SHIFT WITH A SUB-BAND BASIS SPECTRUM MODEL

Masatsune Tamura, Masahiro Morita, Takehiko Kagoshima, Masami Akamine

2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　5124-5127　2011

ISSN： 1520-6149
COVARIANCE CLUSTERING ON RIEMANNIAN MANIFOLDS FOR ACOUSTIC MODEL COMPRESSION

Yusuke Shinohara, Takashi Masuko, Masami Akamine

2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　4326-4329　2010

DOI： 10.1109/ICASSP.2010.5495661 　

ISSN： 1520-6149
UNIT SELECTION SPEECH SYNTHESIS USING MULTIPLE SPEECH UNITS AT NON-ADJACENT SEGMENTS FOR PROSODY AND WAVEFORM GENERATION

Masatsune Tamura, Norbert Braunschweiler, Takehiko Kagoshima, Masami Akamine

2010 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING　4802-4805　2010

DOI： 10.1109/ICASSP.2010.5495151 　

ISSN： 1520-6149
Sub-band Basis Spectrum Model for Pitch-synchronous Log-spectrum and Phase Based on Approximation of Sparse Coding

Masatsune Tamura, Takehiko Kagoshima, Masami Akamine

11TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2010 (INTERSPEECH 2010), VOLS 3 AND 4　2406-2409　2010
BAYESIAN FEATURE ENHANCEMENT USING A MIXTURE OF UNSCENTED TRANSFORMATIONS FOR UNCERTAINTY DECODING OF NOISY SPEECH

Yusuke Shinohara, Masami Akamine

2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS　4569-4572　2009

DOI： 10.1109/ICASSP.2009.4960647 　

ISSN： 1520-6149
Decision Tree Acoustic Models for ASR

Jitendra Ajmera, Masami Akamine

INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5　1379-1382　2009
Feedback Loop for Prosody Prediction in Concatenative Speech Synthesis.

Javier Latorre, Sergio Gracia, Masami Akamine

INTERSPEECH 2009: 10TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2009, VOLS 1-5　2027-2030　2009
Speech Recognition using Soft Decision Trees

Jitendra Ajmera, Masami Akamine

INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5　940-943　2008
Comparative Evaluation of Different Methods for Voice Activity Detection

Hongfei Ding, Koichi Yamamoto, Masami Akamine

INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5　107-110　2008
Multilevel parametric-base F0 model for speech synthesis

Javier Latorre, Masami Akamine

INTERSPEECH 2008: 9TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2008, VOLS 1-5　2274-2277　2008
Feature enhancement by speaker-normalized splice for robust speech recognition

Yusuke Shinohara, Takashi Masuko, Masami Akamine

2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12　4881-4884　2008

ISSN： 1520-6149
HMM-based Speech Recognition Using Decision Trees Instead of GMMs

Remco Teunen, Masami Akamine

INTERSPEECH 2007: 8TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, VOLS 1-4　617-620　2007
Automatic Generation of Optimal Synthesis Units Based on Closed Loop Training.

篭嶋岳彦, 赤嶺政巳

電子情報通信学会論文誌 D-2　J83-D-2　(6)　2000

ISSN： 0915-1923
Toshiba English Text-to-Speech System (TESS) Peer-reviewed

C. K. Suh, T. Kagoshima, M. Morita, S. Seto, M. Akamine

Proc. Eurospeech99　2111-2114　1999
CELP speech coding based on an adaptive pulse position codebook Peer-reviewed

T. Amada, K. Miseki, M. Akamine

IEEE Proc. ICASSP99　13-16　1999
Analytic Generation of Synthesis Units by Closed Loop Training for Totally Speaker Driven Text to Speech System (TOS Drive TTS) Peer-reviewed

M. Akamine, T. Kagoshima

1927-1930　1998
An F0 Contour Control Model for Totally Speaker Driven Text to Speech System Peer-reviewed

T. Kagoshima, M. Morita, S. Seto, M. Akamine

IEEE Proc. ICSLP98　1975-1978　1998
Automatic Rule Generation for Linguistic Features Analysis Using Inductive Learning Technique-Linguistic Features Analysis in TOS Drive TTS System Peer-reviewed

S. Seto, M. Morita, T. Kagoshima, M. Akamine

IEEE Proc. ICSLP98　2031-2034　1998
A 2.4 Kbps Variable Bit Rate ADP-CELP Speech Coder Peer-reviewed

M. Oshikiri, M. Akamine

IEEE Proc. ICASSP　1　517-520　1998
Automatic Generation of Synthesis Units by Selection Based on Closed Loop Training.

篭嶋岳彦, 赤嶺政巳

電子情報通信学会論文誌 D-2　J81-D-2　(9)　1998

ISSN： 0915-1923
A 2.4kbps Variable Bit Rate ADP-CELP Speech Coder.

押切正浩, 赤嶺政巳

電子情報通信学会論文誌 A　J81-A　(11)　1998

ISSN： 0913-5707
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training Peer-reviewed

T. Kagoshima, M. Akamine

IEEE Proc. ICASSP97　2　963-966　1997
Fast Excitation Codebook Search Based on the Orthogonalized Target Vector for CELP Speech Coding.

天田皇, 赤嶺政巳, 三関公生

電子情報通信学会論文誌 A　79　(5)　1996

ISSN： 0913-5707
Adaptive Density Pulse Excitation for Low Bit Rate Speech Coding Peer-reviewed

Masami Akamine, Kimio Miseki

IEICE Trans.　E78　(2)　199-207　1995/02
Improvement of ADP-CELP Speech Coding at 4 Kbits/s Peer-reviewed

M. Akamine, K. Miseki, M. Oshikiri

IEEE Proc. GLOBECOM　1869-1873　1991
Efficient Excitation Model for Low Bit Rate Speech Coding

M. Akamine, K. Miseki

IEEE Proc. ISCAS　586-589　1991
Adaptive Bit-Allocation between the Pole-Zero Synthesis Filter and Excitation in CELP Peer-reviewed

K. Miseki, M. Akamine

229-232　1991
Error Free Calculation Precision of DCT in Image Coding.

菊池義池, 赤嶺政巳

電子情報通信学会論文誌 A　74　(7)　1991

ISSN： 0913-5707
CELP Coding with an Adaptive Density Pulse Excitation Model

M. Akamine, K. Miseki

IEEE Proc. ICASSP　29-32　1990
ARMA Model Based Speech Coding at 8 kb/s Peer-reviewed

M. Akamine, K. Miseki

IEEE Proc. ICASSP　148-151　1989
A class of limit cycle free floating-point digital filters with minimum roundoff noise.

赤嶺政巳, 樋口龍雄

電子情報通信学会論文誌 A　70　(5)　1987

ISSN： 0913-5707
State-Space Approach to Synthesis of Minimum Quantization Error Digital Filter Using Floating-Point Arithmetic Peer-reviewed

M. Akamine, T. Higuchi

IEEE Proc. ISCAS　3　1002-1005　1984/03
浮動小数点演算を用いた量子化誤差最小ディジタルフィルタの合成 Peer-reviewed

赤嶺政巳, 樋口龍雄

電子情報通信学会論文誌 A　66　(10)　895-902　1983/10
浮動小数点演算を用いたディジタルフィルタの状態方程式に基づく量子化誤差解析 Peer-reviewed

樋口龍雄, 赤嶺政巳

電子情報通信学会論文誌 A　66　(3)　186-193　1983/03

Show all ︎Show first 5

Misc. 68

Dereverberation Method to Improve Accuracy of Recognition of Spoken Language Collected by Distant Microphone

籠嶋岳彦, KIM Uihyun, 赤嶺政巳

東芝レビュー(Web)　73　(5)　2018

ISSN： 2432-1168
平静音声から予測した感情付与モデルに基づく統計的感情音声合成

大谷大和, 那須悠, 森田眞弘, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2015　2015

ISSN： 1880-7658
Statistical bandwidth extension using sub-band basis spectrum model

大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

電子情報通信学会技術研究報告　114　(52(SP2014 1-45))　2014

ISSN： 0913-5685
表情豊かな音声と顔画像を合成するシステムXpressiveTalkの開発

森中亮, 那須悠, 田村正統, WAN Vincenty, 柳澤佳代子, STENGER Bjorn, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2014　2014

ISSN： 1880-7658
サブバンド基底スペクトルモデルを用いたGMMに基づく帯域拡張

大谷大和, 田村正統, 森田眞弘, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2014　2014

ISSN： 1880-7658
HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討

大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2014　2014

ISSN： 1880-7658
Shared emotion additive model for HMM-based emotional speech synthesis

大谷大和, 那須悠, 森中亮, 田村正統, 森田眞弘, 赤嶺政巳

電子情報通信学会技術研究報告　114　(303(SP2014 90-105))　2014

ISSN： 0913-5685
サブバンド基底スペクトルモデルを用いたHMM音声合成

大谷大和, 田村正統, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2013　2013

ISSN： 1880-7658
Speech Processing Technologies Becoming Common in Daily Life, and Toshiba’s Approach

赤嶺政巳

東芝レビュー　68　(9)　2013

ISSN： 0372-0462
Text to Speech Technologies in Toshiba-Closed-loop Training to Recent Development-

赤嶺政巳

電子情報通信学会技術研究報告　113　(366(SP2013 82-95))　2013

ISSN： 0913-5685
HMM音声合成による英語音声合成システムの開発

田村正統, KRSTULOVIC Sacha, 森中亮, 徳田龍太郎, 全炳河, 森田眞弘, 籠嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2011　2011

ISSN： 1880-7658
リーマン幾何学に基づく共分散クラスタリングによる音響モデルの圧縮

篠原雄介, 益子貴史, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2010　2010

ISSN： 1880-7658
耐雑音音声認識のためのアンセンテッド変換を用いた特徴強調法

篠原雄介, 赤嶺政巳

日本音響学会研究発表会講演論文集(CD-ROM)　2009　2009

ISSN： 1880-7658
Voice Activity Detection Technology with Robust Performance in Noisy Environments

山本幸一, 赤嶺政巳

東芝レビュー　64　(12)　2009

ISSN： 0372-0462
Generation of Speech Synthesis Units And F₀ Control Rules Based on Closed-Loop Training

篭智岳彦, 赤嶺政巳, 瀬戸重宣, 森田真弘, 志賀芳則

電子情報通信学会技術研究報告　103　(632(SP2003 170-174))　2004

ISSN： 0913-5685
FWFモデルを用いたピッチ波形の閉ループ学習

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2003　2003

ISSN： 1340-3168
スペクトル包絡を制御するためのピッチ波形のモデリング

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2003　2003

ISSN： 1340-3168
コンパクトなテキスト音声合成システムの開発

清水勇詞, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002

ISSN： 1340-3168
TOS-Drive TTSの米・英・独・仏・中国語への応用

平林剛, 森田真弘, 徳田龍太郎, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002

ISSN： 1340-3168
合成辞書作成に用いる音声DBの品質が合成音声に与える影響について

瀬戸重宣, 篭嶋岳彦, 土谷勝美, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002

ISSN： 1340-3168
サブバンド閉ループ学習による音声素片の生成

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002

ISSN： 1340-3168
音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション

小柴亮典, 酒井優, 天田皇, 河村聡典, 正井康之, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002

ISSN： 1340-3168
An F₀ Contour Control Model Using an F₀ Contour Codebook.

篭嶋岳彦, 森田真弘, 瀬戸重宣, 赤嶺政巳, 志賀芳則

電子情報通信学会論文誌 D-2　J85-D-2　(6)　2002

ISSN： 0915-1923
多言語音声認識エンジンの開発

出口豊, 金沢博史, 赤嶺政巳

日本音響学会研究発表会講演論文集　2002　2002

ISSN： 1340-3168
ITS (Intelligent Transport Systems). Onboard Multimedia.

前田賢一, 赤嶺政巳, 加瀬直樹

東芝レビュー　55　(1)　2000

ISSN： 0372-0462
東芝パソコンの音声認識/合成ソフトウェア

正井康之, 桃崎浩平, 松浦博, 田中信一, 鈴木孝子, 赤嶺政巳, 山中紀子, 原義幸

電子情報通信学会大会講演論文集　2000　2000

ISSN： 1349-1369
Generation of phonemic unit corpus based on closed-loop traininng.

赤嶺政巳, 篭嶋岳彦

日本音響学会研究発表会講演論文集　1999　1999

ISSN： 1340-3168
Generating Accentuation Rules using Mora-by-Mora Accent Estimation.

森田真弘, 瀬戸重宣, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998

ISSN： 1340-3168
Digital Signal Processor. A Method of memory saved speech synthesis for DSP.

新居孝章, 瀬戸重宣, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998

ISSN： 1340-3168
CELP speech coding using adaptive pulse position algebraic codebook.

天田皇, 三関公生, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998

ISSN： 1340-3168
Speech synthesis units coding based on vector quantization.

土谷勝美, 篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998

ISSN： 1340-3168
An F0 contour control model using an F0 contour codebook.

篭嶋岳彦, 瀬戸重宣, 森田真弘, 赤嶺政巳

日本音響学会研究発表会講演論文集　1998　1998

ISSN： 1340-3168
A Speech/Silence Segmentation Method using Spectral Variation and the Application to a Variable Rate Speech Codec.

押切正浩, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　(Spring Pt 1)　1997

ISSN： 1340-3168
A Variable Bit Rate Speech Codec using Interframe Pitch Interpolation and Intraframe Pitch-vector Quantization.

押切正浩, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997

ISSN： 1340-3168
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training. Generation of Optimal Synthesis units.

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997

ISSN： 1340-3168
Automatic Generation of Speech Synthesis Units Based on Closed Loop Training. Selection of Representative Units.

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997

ISSN： 1340-3168
CELP coding using pitch pattern.

天田皇, 赤嶺政巳

日本音響学会研究発表会講演論文集　1997　1997

ISSN： 1340-3168
Residue Excited LPC Synthesizer with High Quality Speech.

赤嶺政巳, 篭嶋岳彦, 土谷勝美

情報処理学会研究報告　97　(66(SLP-17))　1997

ISSN： 0919-6072
Introduction of speech recognition and synthesis software of TOSHIBA Co.,Ltd.

松浦博, 正井康之, 原義幸, 新田恒雄, 赤嶺政巳, 瀬戸重宣, 太田治徳, 鈴木孝子, 小林賢一郎

情報処理学会研究報告　97　(66(SLP-17))　1997

ISSN： 0919-6072
A Study on Voice Source Generation for Text-to-Speech Synthesis.

篭嶋岳彦, 赤嶺政巳

日本音響学会研究発表会講演論文集　1996　(Spring Pt 1)　1996

ISSN： 1340-3168
A study of reduction of complexity for 4kbps ADP-CELP speech coding.

天田皇, 赤嶺政巳, 三関公生

日本音響学会研究発表会講演論文集　1996　(Spring Pt 1)　1996

ISSN： 1340-3168
Speech Coding Using Binary-Modulated Vector Quantization.

三関公生, 天田皇, 押切正浩, 赤嶺政巳

日本音響学会研究発表会講演論文集　1995　(Autumn Pt 1)　1995

ISSN： 1340-3168
CELP speech coding using non-orthogonal codebook search.

天田皇, 三関公生, 赤嶺政巳

日本音響学会研究発表会講演論文集　1995　(Spring Pt 1)　1995

ISSN： 1340-3168
Non-orthogonal Codebook Search for Multiple-stage CELP Coders.

天田皇, 赤嶺政巳, 三関公生

電子情報通信学会技術研究報告　94　(372(SP94 53-62))　1994

ISSN： 0913-5685
A study on speech coding using co-orthogonal basis transform.

三関公生, 赤嶺政巳, 天田皇, 押切正浩

電子情報通信学会大会講演論文集　1994　(Shuki Pt 1)　1994

ISSN： 1349-1369
CELP Coding with Individual Adaptive Codebooks for Voiced and Unvoiced Frame.

押切正浩, 赤嶺政巳, 三関公生

電子情報通信学会大会講演論文集　1994　(Shuki Pt 1)　1994

ISSN： 1349-1369
Non-orthogonal Codebook Search for CELP.

天田皇, 三関公生, 赤嶺政巳

電子情報通信学会大会講演論文集　1994　(Shuki Pt 1)　1994

ISSN： 1349-1369
3.75kb/s ADP-CELP speech coder.

三関公生, 赤嶺政巳, 押切正浩

電子情報通信学会技術研究報告　93　(156(SP93 44-48))　1993

ISSN： 0913-5685
LPC Coefficients Quantization Method using Hybrid PARCOR-LSP Vector Quantization.

押切正浩, 赤嶺政巳, 三関公生

電子情報通信学会技術研究報告　93　(156(SP93 44-48))　1993

ISSN： 0913-5685
Speech coding using an adaptive bit allocation between the pole-zero synthesis filter and excitation.

三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1991　(Spring Pt 1)　1991
Variable rate speech coding for ATM networks based on sub-band coding.

吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.3)　1990
An adaptive kl transform coding with arithmetic coding.

菊池義浩, 塚原由利子, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.7)　1990
Variable rate coding for ATM networks based on sub-band coding.

吉川英隆, 赤嶺政巳, 三関公生, 工藤憲昌

電子情報通信学会技術研究報告　89　(385(CS89 92-99))　1990

ISSN： 0913-5685
A study on a implementation of ADP-CELP coding using DSP.

奥田裕二, 赤嶺政巳, 三関公生, 吉田博則

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.1)　1990
Error sensitivity of parameters encoded by adp-celp coding.

神庭進, 三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1990　(Spring Pt.1)　1990
Development of 4.8kbps ADP-CELP voice codec.

佐藤恭子, 渡辺栄一, 赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1990　(Autumn Pt 3)　1990
Selection of transforms for adaptive KL transform coding with variable length code.

塚原由利子, 赤嶺政巳, 大関和夫

電子情報通信学会全国大会講演論文集　1990　(Autumn Pt 6)　1990
A speech coding based on ARMA model and adaptive density pulse model.

赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1989　(Spring Pt.1)　1989
A CELP coding based on adaptive density pulse model.

赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.1)　1989
Analysis of roundoff error in the fast DCT algorithm.

菊池義浩, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.6)　1989
An adaptive KL transform coding with adaptive bit allocation.

赤嶺政巳, 塚原由利子, 大関和夫

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.6)　1989
Improved multi-pulse speech coding using An adaptive compensation filter.

三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1989　(Autumn Pt.1)　1989
Speech quality of an ARMA analysis-synthesis system based on inverse spectrum.

赤嶺政巳, 三関公生

電子情報通信学会技術研究報告　87　(347)　1988

ISSN： 0913-5685
An improvement on ARMA speech analysis.

赤嶺政巳, 三関公生

電子情報通信学会全国大会講演論文集　1988　(Pt. A-1)　1988
A study on 8kbps speech coding using ARMA model.

赤嶺政巳

電子情報通信学会全国大会講演論文集　1988　(Autumn Pt. A-1)　1988
An efficient expression for multi-pulse excition using an adaptive compensation filter.

三関公生, 赤嶺政巳

電子情報通信学会技術研究報告　88　(214)　1988

ISSN： 0913-5685
Multi-pulse speech coding using an adaptive compensation filter.

三関公生, 赤嶺政巳

電子情報通信学会全国大会講演論文集　1988　(Autumn Pt. A-1)　1988
ARMA analysis of speech based on inverse spectrum and autocorrelation method.

赤嶺政巳

電子情報通信学会技術研究報告　87　(306)　1987

ISSN： 0913-5685

Show all ︎Show first 5

Industrial Property Rights 20

対話システム、対話装置、対話方法、及びプログラム

岩田憲治, 藤村浩司, 小林優佳, 吉田尚水, 赤嶺政巳

特許第7132090号

Property Type: Patent
対話システム、方法、及びプログラム

吉田尚水, 岩田憲治, 小林優佳, 赤嶺政巳

特許第7035239号

Property Type: Patent
対話システム、対話方法および対話プログラム

赤嶺政巳, 吉田尚水

特許第6805112号

Property Type: Patent
対話フロー制御装置、対話フロー制御方法およびプログラム

下郡祐美子, 永江尚義, 岩田憲治, 赤嶺政巳

特許第6553007号

Property Type: Patent
音声合成方法、装置及びプログラム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

特許第6246777号

Property Type: Patent
テキスト読み上げシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

特許第6092293号

Property Type: Patent
テキスト音声合成方法及びシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

特許第5847917号

Property Type: Patent
音声処理システム

赤嶺政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

特許第5768093号

Property Type: Patent
テキスト音声合成方法及びシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

特許第5659258号

Property Type: Patent
音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法

ラトレハビエル, 赤嶺政巳

特許第5457706号

Property Type: Patent
対話システム、方法、及びプログラム

吉田尚水, 岩田憲治, 小林優佳, 赤嶺政巳

Property Type: Patent
対話システム、対話装置、対話方法、及びプログラム

岩田憲治, 藤村浩司, 小林優佳, 吉田尚水, 赤嶺政巳

Property Type: Patent
対話システム、対話方法および対話プログラム

赤嶺政巳, 吉田尚水

Property Type: Patent
対話システム、方法、及びプログラム

吉田尚水, 岩田憲治, 小林優佳, 赤嶺政巳

Property Type: Patent
対話フロー制御装置、対話フロー制御方法およびプログラム

下郡祐美子, 永江尚義, 岩田憲治, 赤嶺政巳

Property Type: Patent
音声合成方法、装置及びプログラム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

Property Type: Patent
音声処理システム

赤嶺政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

Property Type: Patent
テキスト読み上げシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー

Property Type: Patent
テキスト音声合成方法及びシステム

赤嶺政巳, ラトーレ・マルティネス・ハビエル, ワン・ビンセント・ピン・ルン, チン・カン・クホン, ゲールズ・マーク・ジョン・フランシス, ニル・キャサリン・マリー, チュン・ビュン・ハ

Property Type: Patent
音声処理システム

赤嶺政巳, ランジョウ・チェン, マーク・ジョン・フランクルズ・ゲールズ, キャサリン・メリー・ニル

Property Type: Patent

Show all Show first 5

Academic Activities 13

電子情報通信学会論文査読委員

1997/04 - Present
IEEE論文査読委員

2007/01 - 2023/12
IEEE Speech and Language Technical Committeeメンバー

2018/01 - 2020/12
Asia-Pacific Signal and Information Processing Association Industrial membership Committeeメンバー

2016/04 - 2019/12
ISCA Industrial Liaison Committee委員

2010/01 - 2019/12
IEEE Spoken Language Technology Workshop (SLT), Organizing Committeeメンバー

2018/01 - 2018/12
ISCA主催国際会議 (Interspeech 2008、2010、2012、2013、2014、2015、2018)

2008/01 - 2018/12
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2017, Organizing Committeeメンバー

2017/04 - 2017/12
IEEE主催国際会議 (ICASSP 2012、2013、2014)セッションチェアー

2012/01 - 2014/12
IEEE Speech and Language Technical Committeeメンバー

2012/01 - 2013/12
IEEE CHiME-2013 ボードメンバー

2013/01 - 2013/06
ISCA Speech Synthesis Workshop (SSW7)プログラム委員

2010/01 - 2010/12
電子情報通信学会論文誌特集号編集委員

1997/01 - 1997/12

Show all Show first 5