MacInTalk
PlainTalk es el nombre colectivo de varias tecnologías síntesis de voz (MacinTalk) y reconocimiento de voz desarrolladas por Apple Inc.. En 1990, Apple invirtió mucho trabajo y dinero en tecnología de reconocimiento de voz, contratando a muchos investigadores en el campo. El resultado fue "PlainTalk", lanzado con los modelos AV en la serie Macintosh Quadra desde 1993. Se fabricó como un componente estándar del sistema en System 7. 1.2, y desde entonces enviado en todos PowerPC y algunos otros 68K Macintosh.
Software
Tecnología
Los usos de texto a voz de Apple diphone s. Comparado con otros métodos de sintetizar el habla, no es muy intensivo en recursos, pero limita lo natural que puede ser la síntesis de voz. Las versiones American English y Spanish están disponibles, pero desde la llegada de Mac OS X, Apple ha enviado solo voces en inglés americano, confiando en proveedores externos como [[Acapela Group] ] para suministrar voces para otros idiomas (en OS X 10.7, Apple otorgó licencias para muchas voces de terceros y las puso a disposición para su descarga dentro del panel de control de Speech).
Una interfaz de programación de aplicaciones conocida como Speech Manager permite a los desarrolladores externos utilizar la síntesis de voz en sus aplicaciones. Hay varias secuencias de control que se pueden usar para afinar la entonación y el ritmo. El volumen, tono y la velocidad de la voz también se pueden configurar.
La entrada al sintetizador se puede controlar explícitamente usando un phoneme alphabet.
MacinTalk original
Apple utilizó el motor de texto a voz inicial de Macintosh, MacinTalk (nombrado por Denise Chandler), en la introducción en 1984 de Macintosh en la que la computadora se anunció al mundo (y se burló de El peso de una computadora IBM). Si bien se incorporó al sistema operativo del Macintosh, no fue oficialmente compatible con Apple (aunque la información de programación estuvo disponible a través de una Nota técnica de Apple). MacinTalk fue desarrollado por Joseph Katz y Mark Barton, quienes más tarde fundaron SoftVoice, Inc.] que actualmente comercializa motores TTS para Windows, Linux y plataformas integradas.
MacinTalk 2
Finalmente, Apple lanzó un sistema de síntesis de voz compatible, llamado MacinTalk 2. Es compatible con cualquier Macintosh que ejecute System Software 6.0.7 o posterior. Se mantuvo como la versión recomendada para máquinas más lentas, incluso después del lanzamiento de MacinTalk 3 y Pro.
MacinTalk 3, Pro
MacinTalk 3 introdujo una gran variedad de voces. Además de las voces adultas estándar "Ralph", "Fred" y "Kathy", y voces de niños como "Princess" y "Junior", se incluyeron varias voces novedosas, como "Whisper", "Zarvox" (una voz robótica con melódica sonidos de fondo, con una voz similar llamada "Trinoids" también incluida), "Cellos" (una voz que cantó su texto a una Edvard Grieg melodía, con similar voces cantantes como "Good News", "Bad News", "Pipe Organ"), "Albert" (una voz ronca), "Bells", "Boing", "Bubbles", y otras.
Cada una de estas voces vino con su propio texto de ejemplo, que se emitiría cuando uno presionara el botón "Prueba" en el panel de control de Voz. Algunos solo dirían su nombre, idioma y la versión de MacinTalk con la que fueron introducidos. Otros dirían cosas gracioso, como "Me gusta estar dentro de esta elegante computadora", "Tengo una rana en la garganta ... No, me refiero a una verdadera rana", "Debemos regocijarnos en esta mórbida voz "(una parodia de Iglesia occidental con música de órgano), o" La luz que se ve al final del túnel es el faro de un tren que se aproxima rápidamente " . Estas voces, así como sus textos de prueba, todavía están en Mac OS X en la actualidad.
Con el aumento en la potencia de cómputo que brindan los equipos Mac basados en AV Mac y PowerPC, Apple podría permitirse aumentar la calidad de la síntesis. MacInTalk 3 requirió un 33 MHz 68030 procesador y MacinTalk Pro requirió un 68040 o mejor y al menos 1 MB de RAM. Cada sintetizador soporta un conjunto diferente de voces.
Texto a voz en Mac OS X
Text-to-speech ha sido parte de cada versión de Mac OS X. La voz de Victoria se mejoró significativamente en Mac OS X v10.3, y se agregó como Vicki (Victoria no se eliminó). Su tamaño era casi 20 veces mayor, debido a las muestras de diphone de mayor calidad utilizadas.
Una nueva voz, mucho más natural, llamada "Alex" se ha agregado a la lista de texto a voz de Mac con el lanzamiento de Mac OS X 10.5 Leopard.[1]
Con Mac OS X 10.7 Lion, las voces están disponibles en inglés adicional de los EE. UU. Y otros acentos en inglés, así como en otros 21 idiomas. [2]
La función Hablar texto seleccionado cuando se presiona la tecla permite que el texto seleccionado de cualquier aplicación se lea mediante una combinación de teclas. Desde Mac OS X 10.1 a Mac OS X 10.6, la función copiaría el texto seleccionado al portapapeles y lo leería desde allí. Desde Mac OS X 10.7 hasta Mac OS X 10.10, una nueva implementación de la función requería que los desarrolladores de software implementaran una síntesis de voz API en sus aplicaciones.[3][4] Esto evitó que El portapapeles no se sobrescribió, pero también significaba que, para las aplicaciones que no usaban la API, la función no funcionaría como se esperaba, al leer la barra de título en lugar del texto seleccionado.[5][6]
Reconocimiento de voz
Apple contrató a muchos investigadores de reconocimiento de voz en 1990. Después de aproximadamente un año, demostraron una tecnología llamada Casper. Fue lanzado como parte del paquete PlainTalk en 1993. Aunque está disponible para todas las máquinas Macintosh de PowerPC y AV 68k (fue una de las pocas aplicaciones que hizo uso del DSP en el Centris 660AV y Quadra 840AV, no formaba parte de la instalación predeterminada del sistema antes de Mac OS X, lo que requiere que el usuario realice una instalación personalizada del sistema operativo para obtener capacidades de reconocimiento de voz.
En Mac OS X 10.7 Lion y en versiones anteriores, el reconocimiento de voz de Apple estaba orientado únicamente al comando de voz, es decir, no estaba destinado a dictado. Se puede configurar para escuchar los comandos cuando se presiona una tecla de acceso rápido, después de que se dirija con una frase de activación como "Computadora", "Macintosh" o sin aviso. Un monitor de estado gráfico, a menudo en forma de un personaje animado, proporciona información visual y textual sobre el estado de escucha, los comandos disponibles y las acciones. También puede comunicarse con el usuario utilizando la síntesis de voz.
Las primeras versiones del reconocimiento de voz proporcionaban acceso completo a los menús. Este soporte se eliminó posteriormente, ya que requería demasiados recursos y hacía que el reconocimiento fuera menos confiable, solo para volver a agregarlo en Mac OS X 10.3 como una "tecnología de acceso universal" denominada interfaz de usuario hablada.
El usuario puede lanzar elementos ubicados en una carpeta especial, llamada "Elementos que se pueden hablar", simplemente diciendo su nombre (mientras el sistema está en el modo escuchar ). Apple envió una cantidad de AppleScript en esta carpeta, pero alias, documento y carpeta s se pueden abrir en de la misma manera
La funcionalidad adicional es proporcionada por aplicaciones individuales. Una interfaz de programación de aplicaciones permite a los programas definir y modificar un vocabulario disponible. Por ejemplo, Finder proporciona un vocabulario para manipular archivos y ventanas.
En OS X 10.8 Mountain Lion, Apple introdujo “Dictation,[7] ”destinado a texto general. Originalmente, requería el envío de datos de audio a los servidores de Apple para su procesamiento. En OS X 10.9 Mavericks, Apple agregó la opción de descargar soporte para dictado sin conexión a Internet. A partir de OS X 10.9.3, se admiten ocho idiomas (19 dialectos).
En cultura popular
En la radio
La síntesis de voz de MacinTalk se puede escuchar en algunos programas de radio:
- Algunas de las secuencias de radio de la serie British Radio 1 Blue Jam usan MacinTalk. [8]
En música
La síntesis de voz de MacinTalk se puede escuchar en algunas canciones:
- "Vicki" de MacinTalk habla durante los descansos en Studio Killers '"In Tokyo".
- El álbum "Shadows Are Security" de As I Lay Dying usó MacinTalk en la introducción.
- " Satisfacción" por Benny Benassi, así como otras canciones de él
- "Toby's Mac" por tobyMac
- La canción de Radiohead "Fitter Happier" del álbum OK Computer (y aparece en el fondo de "Paranoid Android" del mismo álbum)
- Fall Out Boy usó MacinTalk al principio de "The Grand Theft Autumn / Where Is Your Boy" (versión Millennium) y al final de la última pista y pistas adicionales en su Infinity en alto album
- La banda francesa Air usa varias voces de Macintosh en su pista "Cómo te hace sentir"
- "Yoshimi Battles the Pink Robots, Pt. 1" por Flaming Lips presenta la voz "Zarvox"
- Muchas de las Aphex Twin pistas que incluyen " Funny Little Man" y " Cow Cud Is a Twin" también incluyen PlainTalk
- La canción "John Orr the Arsonist" de And Then There Were None presenta un monólogo corto con esta voz. <! - ¿Qué voz? ->
- El álbum FanMail 'de "The Vic-E Interpretation - Interlude" de TLC presenta a "Victoria" comparando y contrastando la cultura de clubes en los Estados Unidos y Japón.
- El álbum "Intro" de OutKast Stankonia presenta la voz de "Bells".
- La canción "Pomme C" del cantante francés Calogero en el álbum Pomme C presenta un monólogo corto al principio usando la voz "Vicki"
- "DWYL" por Phil Joel
- La canción "Man That You Fear" de Marilyn Manson termina con las voces de MacinTalk repitiendo: "Cuando estás sufriendo, debes saber que te he traicionado". Las voces de MacinTalk se utilizan nuevamente en el video musical[9] y actuaciones en vivo de " Antichrist Superstar". Las voces de MacinTalk repiten: "También podrías matarte, ya estás muerto" al final de la canción.
- La mayoría de Mr Oizo 's' ' Transsexual' 'EP y el álbum' 'Lambs Anger' 'contienen voces de MacinTalk
La canción "Bo Peep Bo Peep" de Korea Idol T-ara del Absolute First Album introducción parte 'No pierdas la paciencia tan rápidamente'
- La canción El-P "Stepfather Factory", del álbum Damage de 2002, termina con las voces de MacinTalk repitiendo "¿Por qué haces que te lastime? Te amo".
- La banda de EBM Apoptygma Bezerk utilizó la voz de MacinTalk Kathy en "La canción de Kathy (Come Lie Next To Me)". El VNV Nation Remix también usa la voz "Victoria".
- En la pista del productor de EDM Skrillex titulada "I Wish You All The Luck Of The World", la voz de MacinTalk "Alex" se puede repetir "David, les deseo a todos La suerte en el mundo "varias veces en varios lanzamientos.
- La canción de 1997 Rob & Goldie "The Shadow (The Process Mix de Rick Smith para Underworld)" hace un uso extensivo de "Victoria" voz, leyendo una definición del diccionario de "sombra" y un poema del libro Proceso: Un proyecto de tomate .
- El álbum "Jean-Michel Jarre" Métamorphoses "del 2000 usa MacinTalk para generar letras en la canción" Love, Love, Love ".
- La línea de apertura de " Treasure" por Bruno Mars en el álbum 'Unorthodox Jukebox' 'es la voz de Alex que dice: "Baby Squirrel, tú eres un hijo de puta sexy ".
- En "Sometimes Things Get, Whatever" de deadmau5 en el álbum Random Album Title , la línea en bucle "A veces las cosas se complican" es una combinación de "Ralph" y "Kathy" voces
- El acto electrónico alemán Monolake usa la voz PlainTalk "Whisper" en la canción "Bicom" en su álbum "Cinemascope".
- El sintetizador virtual chipspeech de Plogue Art et Technologie emula MacinTalk 1.0.
En la película
- Una combinación de las voces "Ralph" y "Bad News" sirve como la voz de la computadora piloto automático, AUTO, en la película 2008 ' Disney - Pixar WALL-E . "MacInTalk" se acredita como la voz de Auto en los créditos finales de la película. [10]
- En La película de Lego, la voz de Samantha se usa en lugar de la computadora Mega.
- La película de Lego Batman también presentó a Samantha como la voz del jugador de Batman. (En créditos, es reconocido como Siri)
En televisión
- MacinTalk se usó para realizar la parte del paciente con neurona motora que usa una silla de ruedas con un sintetizador de voz en el animación Padre de familia episodio " Ready, Willing and Disabled ", que luego aparecería nuevamente en" Brian the Bachelor "y" Brian Goes Back to College ". Además, se usó en "Peterotica", cuando Stewie juega con "la función de voz en su Macintosh", usando el software Talking Moose, Stewie hace que su computadora portátil diga "Stewie es genial. " y también en "April in Quahog" donde MacinTalk Fred expresa Stephen Hawking.
- También se usó para introducir episodios en el anime Serial Experiments Lain .
- En los primeros años de Adult Swim, la voz de MacinTalk se usó como anunciador del antiguo bloque "Adult Swim Action".
- En los episodios Transformers Animated '"TransWarped", "Decepticon Air" y "This is Why Why I Hate Machines", la voz de Autobot Perceptor se ejecutó a través de Generación de habla MacinTalk, utilizando la voz "Fred".
- También se usó en el dibujo animado 'Whatever Happened to ... Robot Jones?' 'Como la voz del padre de Robot Jones, Dad Unit y Robot en la primera temporada.
- También se usó como la voz para el personaje Red vs. Blue , el mentiroso A.I Gary / Gamma. <! - ¿No es realmente televisión? ->
- "Junior" estaba expresando a Robot Jones en el episodio 2000 de The Cartoon Cartoon Show , "¿Qué fue de ... Robot Jones?".
- La voz de la novedad de Mac OS X, "Boing", se usó para la cara del robot (SSF / Splaat) para Klasky Csupo. <! - ¿Combinar con la mención anterior? ->
- En uno de [Boomerang (canal de TV) | Boomerang's]] bloques más antiguos Boomeraction, la voz utilizada en el bloque era una versión de tono bajo de la voz novedosa "trinoide".
- En el episodio Venture Bros "All This and Gargantua-2", la voz se usa para los robots en la estación espacial titular.
- Se usó en Scrapheap Challenge Season 1 como la voz que anuncia el tiempo restante para los desafíos.
- La voz de MacinTalk "Junior" se usó en el episodio Wayside "Mad Hot".
- Se usó una versión de tono más bajo de la voz "Trinoids" para el bloque de acción de Boomerang, Boomeraction.
- En un episodio de Doki , la voz de "Trinoids" se usa en "To Catch A Fish".
- Se usó una vez en Hi Hi Puffy AmiYumi en el episodio "Mean Machine".
- La voz de "Fred" se usó en programas como Wonder Showzen y Space Ghost Coast to Coast .
En videojuegos
- MacinTalk se usó en la versión japonesa del juego Killer7 , como las voces de los Remyant Psyches.
- MacinTalk se utilizó en el juego No More Heroes . Antes de cada pelea del jefe, la voz de "Susurro" anunciaría el nombre del jefe actual.
- El videojuego Grand Theft Auto IV usó "Vicki" como la voz del DJ de la estación de radio del juego " The Journey" .
- El videojuego de 2009 Machinarium presenta varias voces de Macintalk en su música ambiental.
- La versión de 3DO de Star Control 2 usó "Bruce" como la voz de la sonda Slylandro. El juego acredita la voz de la sonda como 840AV. "Agnes" también se usó como la voz de la computadora de la nave del Capitán, escuchada en el primer encuentro con la raza Orz.
- El videojuego de 1996 Safecracker utiliza "Victoria" en dos de las cajas fuertes avanzadas.
- La versión japonesa de Sonic CD usó voces de MacinTalk en la música de fondo de los escenarios Bad Future de Metallic Madness.
- El videojuego Castle Crashers utilizó la novedosa voz Boing, para un personaje conocido como The Painter.
- El videojuego de 2003 Shin Megami Tensei: Nocturne utilizó "Albert" para las voces en su banda sonora.
Hardware
Apple produjo dos micrófono s bajo el nombre de "Apple PlainTalk Microphone". El primer producto incluido, incluido con los modelos Macintosh LC y Early Performa, fue circular en apariencia. Fue diseñado para sentarse en un soporte adjunto al lado de una pantalla CRT, y se levanta y sujeta por la boca cuando se habla. El segundo modelo se introdujo junto con los modelos AV en la serie Macintosh Quadra en 1993, pero también se vendió por separado. Fue diseñado para colocarse en la parte superior de la pantalla y ser sensible al sonido desde la parte frontal. Ambos modelos tenían un conector más largo, cuya punta se usó para proporcionar al micrófono tensión de polarización.
Referencias
- «Accesibilidad - OS X». Apple. Consultado el 27 de abril de 2016.
- «Copia archivada». Archivado desde el original el 24 de septiembre de 2011. Consultado el 23 de julio de 2011.
- { {cite web | url = https://developer.apple.com/library/mac/documentation/UserExperience/Conceptual/SpeechSynthesisProgrammingGuide/Introduction/Introduction.html | title = Introduction to Speech Synthesis Programming Guide | website = Developer.apple.com | fecha = 5 de septiembre de 2006 | accessdate = 27 de abril de 2016}}
- Conceptual / SpeechSynthesisProgrammingGuide / SpeechOverview / SpeechOverview.html «Síntesis de voz en OS X». Developer.apple.com. 5 de septiembre de 2006. Consultado el 27 de abril de 2016.
- f = 7 & t = 74278 «[Solucionado & # 93; Texto a voz solo lee el título del documento (Ver tema) • Apache OpenOffice Community Forum». Forum.openoffice.org. Consultado el 27 de abril de 2016.
- «scottmartin / speak-selected-text-sublime: un complemento para usar el texto de Mac en voz desde Sublime Text 2». GitHub.com. Consultado el 27 de abril de 2016.
- «Usa tu voz para ingresar texto en su Mac - Soporte de Apple». Support.apple.com. 5 de abril de 2016. Consultado el 27 de abril de 2016.
- watch? v = fFxNGd69-aM «Chris Morris - Blue Jam - Steve Lamacq Sting». YouTube. BBC Radio 1. Consultado el 30 de noviembre de 2014.
- [http:// www. nme.com/nme-video/youtube/id/C1gaD5eFzbw «Marilyn Manson - Video oficial de Antichrist Superstar»]. Video oficial de Antichrist Superstar. NME.com. Consultado el 15 de agosto de 2011.
- Steve "Capone" Prokopy (24 de junio de 2008). «Andrew Stanton entrega los bienes en WALL-E y JOHN CARTER a Capone!». Ain't It Cool News. Consultado el 22 de noviembre de 2008.