Descript, Andrew Mason’s platform to edit audio by editing text, now lets you edit video, too

@ingridlunden/10:07 am PDT – 21 de outubro de 2020

Image Credits: Descript

Descript, a última inicialização do co-fundador da Groupon Andrew Mason, fez um splash no mundo do áudio no ano passado com uma plataforma para edição de áudio fácil baseado na forma como você edita documentos escritos, adicionando recursos como uma ferramenta baseada em IA que usa uma gravação de você para permitir que você crie áudio de qualquer texto escrito em sua própria voz.

Hoje a inicialização está se movendo para a próxima fase de seu crescimento. Está lançando Descrever Vídeo, com um conjunto de ferramentas para tirar gravações de tela ou vídeos e, em seguida, criar títulos, transições, imagens, sobreposições de vídeo ou edições sobre eles, sem mais esforço do que é necessário para editar um documento Word. Também possui links de colaboração ao vivo para que várias pessoas possam trabalhar em um arquivo ao mesmo tempo – semelhante a um Google Doc – por meio de links que você pode compartilhar com outras pessoas no próprio arquivo.

Você trabalha com vídeo em Descrito da mesma forma que faz áudio: você carrega a matéria prima na plataforma Descrito, que depois a transforma em texto. Então você adiciona novos recursos, ou remove seções, ou adiciona novas partes, adicionando widgets ou cortando ou adicionando palavras escritas.

As ferramentas de vídeo são lançadas hoje como parte do serviço gratuito de Descript, com níveis de preços básicos de grátis, $12 e $24 por mês, dependendo de quais recursos você leva.

O lançamento do Descript vem em um momento chave no mundo da tecnologia. Antes da pandemia da COVID-19, o vídeo já era o rei da colina do conteúdo, graças aos avanços no streaming, velocidades de banda larga, processadores em dispositivos, uma proliferação de serviços e a inclinação da sociedade para se inclinar para trás e assistir às coisas em seus tempos de lazer.

Sim, algumas pessoas ainda lêem. E podcasts, livros gravados e outros formatos levaram definitivamente a uma espécie de renascimento para o áudio. Mas o vídeo corta tudo isso quando se trata de tempo gasto online e envolvimento do consumidor. Como os gatos, parece que somos apenas atraídos por objectos em movimento.

Agora temos mais uma reviravolta adicional. A pandemia se tornou a era do vídeo no mundo do trabalho, do aprendizado e da diversão, com plataformas como Zoom, Meet, Teams e WebEx assumindo o papel de sala de conferências, café rápido, jantar, pub e qualquer outro lugar que você possa ter escolhido para conhecer pessoas antes de COVID-19 aparecer.

“Estamos vivendo cada vez mais em um mundo de vídeo primeiro”, disse Mason na outra semana de sua casa na Bay Area, por causa de uma chamada de Zoom. Tudo isso significa não apenas uma tonelada de vídeo, mas uma tonelada de criadores de vídeo, contando não apenas os cerca de 50 milhões fazendo conteúdo para Twitch, YouTube, Instagram, Snapchat e o resto, mas também qualquer um de nós que está tirando uma foto em movimento e postando-a em algum lugar, seja por diversão ou por pagamento.

Video estava sempre nas cartas de Descritores, Mason acrescentou, mas fazia sentido primeiro focar nas ferramentas de áudio. Isso foi em parte porque o próprio Descrito era um spin-off do Detour (um desvio do Detour, como acontece), um negócio de áudio-guia que foi vendido à Bose, e assim o som era o foco.

“Há tanto para construir, então queríamos começar com alguma versão do produto, e depois adicionar características em círculos concêntricos de mercados endereçáveis”, disse Mason.

E é essencialmente assim que a empresa vê a oportunidade de vender um produto de edição de vídeo como uma extensão de uma ferramenta de edição de áudio”. As pessoas que produzem conteúdo para podcasts muitas vezes também produzem vídeos, e aqueles que começaram em uma plataforma como o YouTube estão agora expandindo suas pegadas com a palavra gravada. Às vezes há material distinto criado para uma ou outra plataforma, mas muitas vezes há trechos redirecionados, ou versões completas de áudio de vídeo transformadas em podcasts.

YouTubers ou podcasters, entretanto, têm algo em comum com a pessoa comum: Todos estão usando tecnologia agora para produzir conteúdo, mas nem todos sabem como trabalhar com ela em um nível técnico se você precisa cortá-lo, editá-lo ou manipulá-lo de alguma forma.

Descript’s voltados para profissionais e prosumers, mas na verdade ele também segue na veia de ferramentas que permitem que as pessoas construam sites sem precisar saber HTML ou ter experiência especial em design; ou usar qualquer peça de software sem ter que construir a funcionalidade antes de usá-lo. Com todos os avanços da tecnologia atual, essa idéia percorreu um longo caminho nos tempos modernos.

“Antes de entrar na tecnologia, eu era um estudante de música. Eu me formei em tecnologia da música e trabalhei em um estúdio de gravação. Eu uso essas ferramentas desde criança e as conheço super bem”, disse Mason. “Mas a nossa abordagem tem sido pensar em nós como Airtable. Queremos fazer parte dessa classe moderna de produtos SaaS que não significa que você precise fazer uma troca entre potência e facilidade de uso”

Ferramentas nesta primeira construção do vídeo incluem não apenas a capacidade de importar vídeo de qualquer lugar que você possa editar, mas também um gravador de tela que você pode usar para gravar trechos de outros lugares, ou mesmo de toda a sua tela, que depois pode ser editada como itens autônomos, ou como parte de trabalhos maiores. Coisas como esta parecem particularmente destinadas à nova classe de “produtores de vídeo” que na verdade são trabalhadores do conhecimento criando material para compartilhar com colegas ou clientes.

While Overdub – a característica que usa processamento de linguagem natural para permitir que você crie um “deepfake” de sua própria voz para sobrepor novo áudio em uma gravação, digitando algo para fora – funciona muito suavemente em uma gravação de áudio, onde seria difícil perceber onde as mudanças foram feitas, em vídeo, corta o trabalho como pequenos saltos, e Overdubs simplesmente saem como áudio adicionado no vídeo. Embora saltos de áudio e vídeo sejam muito comuns hoje em dia nos vídeos, eu imagino que a empresa está provavelmente trabalhando em uma maneira de suavizar isso para espelhar a experiência de áudio como ela é hoje.

Descript hoje em dia é usado por uma série de grandes editoras de conteúdo, incluindo NPR, Pushkin Industries, VICE, The Washington Post e The New York Times, embora Mason se recusou a revelar quantos usuários tem no total.

Em algum momento, no entanto, os números vão contar outro tipo de história: o quanto a Traction Descript está ficando entre as massas de competição no campo. Plataformas como Zoom e Google também estão adicionando mais ferramentas de edição, e há uma infinidade de outras construindo softwares fáceis de usar para melhor trabalhar com áudio e vídeo, desde Otter.ai até Scribe, Vimeo, Adobe, Biteable e muito mais.

Entretanto, Descrito chamou a atenção de alguns patrocinadores importantes, levantando cerca de $20 milhões até hoje de investidores, incluindo Andreessen Horowitz e Redpoint.

{{{título}}

{{{data}}{{autor}}

Deixe uma resposta

O seu endereço de email não será publicado.