Crédits images : Descript
Descript, la dernière startup du cofondateur de Groupon, Andrew Mason, a fait sensation dans le monde de l’audio l’année dernière avec une plateforme d’édition audio facile basée sur la façon dont vous éditez des documents écrits, ajoutant des fonctionnalités comme un outil basé sur l’IA qui utilise un enregistrement de vous pour vous permettre de créer l’audio de n’importe quel texte écrit avec votre propre voix.
Aujourd’hui, la startup passe à la phase suivante de sa croissance. Elle lance Descript Video, avec un ensemble d’outils permettant de prendre des enregistrements d’écran ou des vidéos, puis de créer des titres, des transitions, des images, des superpositions vidéo ou des montages sur ceux-ci sans plus d’effort qu’il n’en faut pour éditer un document Word. Il propose également des liens de collaboration en direct afin que plusieurs personnes puissent travailler sur un fichier en même temps – à la manière d’un Google Doc – par le biais de liens que vous pouvez partager avec d’autres personnes vers le fichier lui-même.
Vous travaillez avec la vidéo sur Descript de la même manière que vous le faites avec l’audio : vous téléchargez le matériel brut sur la plateforme Descript, qui le transforme ensuite en texte. Ensuite, vous ajoutez de nouvelles fonctionnalités, ou supprimez des sections, ou ajoutez de nouvelles parties, en ajoutant des widgets ou en coupant ou ajoutant des mots écrits.
Les outils vidéo sont lancés aujourd’hui dans le cadre du service freemium de Descript, avec des paliers de prix de base gratuits, 12 $ et 24 $ par mois, en fonction des fonctionnalités que vous prenez.
Le lancement de Descript intervient à un moment clé dans le monde de la technologie. Avant la pandémie de COVID-19, la vidéo était déjà le roi de la colline du contenu, grâce aux progrès du streaming, des vitesses de haut débit, des processeurs sur les appareils, de la prolifération des services et de l’inclinaison de la société à se pencher et à regarder des choses pendant son temps libre.
Oui, certaines personnes lisent encore. Et les podcasts, les livres enregistrés et d’autres formats ont certainement conduit à une sorte de renaissance pour l’audio. Mais la vidéo passe au travers de tout cela lorsqu’il s’agit du temps passé en ligne et de l’engagement des consommateurs. Comme les chats, il semble que nous soyons simplement attirés par les objets en mouvement.
Nous avons maintenant un autre rebondissement supplémentaire. La pandémie est devenue l’ère de la vidéo dans les mondes du travail, de l’apprentissage et du jeu, avec des plateformes comme Zoom, Meet, Teams et WebEx prenant le rôle de salle de conférence, de café rapide, de dîner, de pub et de tout autre endroit que vous auriez pu choisir pour rencontrer des gens avant l’arrivée de COVID-19.
« Nous vivons de plus en plus dans un monde de vidéo-first », a déclaré Mason l’autre semaine depuis sa maison dans la Bay Area, lors d’un appel Zoom. Tout cela signifie non seulement une tonne de vidéos, mais aussi une tonne de créateurs de vidéos, en comptant non seulement les quelque 50 millions de personnes qui créent du contenu pour Twitch, YouTube, Instagram, Snapchat et le reste, mais aussi n’importe lequel d’entre nous qui prend une image en mouvement et la poste quelque part, que ce soit pour le plaisir ou pour le salaire.
La vidéo a toujours été dans les cartes pour Descript, a ajouté Mason, mais il était logique de se concentrer d’abord sur les outils audio. C’était en partie parce que Descript lui-même était un spin-off de Detour (un détour de Detour, comme il se trouve), une entreprise d’audio-guides qui a été vendue à Bose, et donc le son était le centre d’intérêt.
« Il y a tellement de choses à construire, donc nous voulions commencer avec une certaine version du produit, puis ajouter des fonctionnalités par cercles concentriques de marchés adressables », a déclaré Mason.
Et c’est essentiellement ainsi que la société voit l’opportunité de vendre un produit d’édition vidéo comme une extension d’un outil d’édition audio. Les personnes qui produisent du contenu pour les podcasts produisent aussi souvent des vidéos, et ceux qui ont fait leurs débuts sur une plateforme comme YouTube étendent maintenant leurs empreintes avec des mots enregistrés. Parfois, il y a du matériel distinct créé pour l’une ou l’autre plateforme, mais souvent il y a des extraits réaffectés, ou des versions complètes de l’audio de la vidéo transformées en podcasts.
Les YouTubers ou les podcasters, quant à eux, ont quelque chose en commun avec la personne moyenne : Tout le monde utilise désormais la technologie pour produire du contenu, mais tout le monde ne sait pas comment travailler avec elle à un niveau technique si vous devez la couper, l’éditer ou la manipuler de quelque manière que ce soit.
Descript s’adresse aux professionnels et aux prosumers, mais en réalité, il s’inscrit également dans la veine des outils qui permettent aux gens de créer des sites Web sans avoir besoin de connaître le langage HTML ou d’avoir une expérience particulière en matière de conception ; ou d’utiliser n’importe quel logiciel sans avoir à construire la fonctionnalité avant de l’utiliser. Avec tous les progrès de la technologie actuelle, cette idée a fait un long chemin dans les temps modernes.
« Avant de me lancer dans la technologie, j’étais major en musique. J’ai obtenu un diplôme en technologie musicale et j’ai travaillé dans un studio d’enregistrement. J’utilise ces outils depuis que je suis enfant et je les connais super bien », a déclaré Mason. « Mais notre approche a été de nous considérer comme Airtable. Nous voulons faire partie de cette classe moderne de produits SaaS qui ne signifient pas que vous devez faire un compromis entre la puissance et la facilité d’utilisation. »
Les outils dans cette première construction de la vidéo comprennent non seulement la capacité d’importer des vidéos de n’importe où que vous pouvez éditer, mais aussi un enregistreur d’écran que vous pouvez utiliser pour enregistrer des extraits d’autres endroits, ou même tout votre écran, qui peuvent ensuite être édités comme des éléments autonomes, ou dans le cadre de travaux plus importants. Les choses de ce genre semblent particulièrement destinées à la nouvelle classe de « producteurs vidéo » qui sont en fait des travailleurs du savoir créant du matériel à partager avec des collègues ou des clients.
Alors que l’Overdub – la fonctionnalité qui utilise le traitement du langage naturel pour vous permettre de créer un « deepfake » de votre propre voix pour superposer un nouvel audio dans un enregistrement en tapant quelque chose – fonctionne très bien sur un enregistrement audio, où vous auriez du mal à remarquer où les changements ont été faits, sur la vidéo, les coupures fonctionnent comme de petits sauts, et les Overdubs apparaissent simplement comme de l’audio ajouté dans la vidéo. Alors que les sauts audio et vidéo sont assez courants de nos jours dans les vidéos, j’imagine que l’entreprise travaille probablement sur un moyen de lisser cela pour refléter l’expérience audio telle qu’elle est aujourd’hui.
Descript est aujourd’hui utilisé par un certain nombre d’éditeurs de contenu de renom, notamment NPR, Pushkin Industries, VICE, le Washington Post et le New York Times, bien que Mason ait refusé de révéler combien d’utilisateurs il a au total.
À un moment donné, cependant, les chiffres diront un autre genre d’histoire : à quel point Descript obtient de la traction parmi les masses de concurrence dans le domaine. Des plateformes comme Zoom et Google ajoutent également plus d’outils de montage, et il y a une pléthore d’autres personnes qui construisent des logiciels faciles à utiliser pour mieux travailler avec l’audio et la vidéo, d’Otter.ai en passant par Scribe, Vimeo, Adobe, Biteable et plus encore.
En attendant, Descript a attiré l’attention de certains bailleurs de fonds importants, levant à ce jour quelque 20 millions de dollars auprès d’investisseurs, dont Andreessen Horowitz et Redpoint.
{title}}
{{date}}{{auteur}}
.