• Comunicazioni

OCR video più intelligente

La ricerca di un OCR video più intelligente è iniziata molti anni fa. Ma tutto è iniziato con il testo.

Oggi i motori di ricerca hanno fatto una scienza dell'indicizzazione del testo. I moderni spider trovano e registrano ogni singola parola scritta e restituiscono i risultati in modo così efficiente che alcuni esperti di efficienza consigliano di abbandonare i sistemi di archiviazione delle e-mail e le barre dei preferiti dei browser web e di affidarsi semplicemente alla ricerca per trovare ciò che serve.

Tuttavia, per la maggior parte delle organizzazioni, la profondità della capacità di ricerca è riservata al solo testo. Il video, in particolare, rimane una scatola nera, limitata ai metadati inseriti manualmente come titoli e tag.

L'OCR video è un problema che deve essere risolto

Secondo uno studio condotto da McKinsey e IDC, il lavoratore medio della conoscenza trascorre quasi il 20% del proprio tempo, quasi un giorno intero, ogni settimana, solo alla ricerca delle informazioni di cui ha bisogno per svolgere il proprio lavoro in modo efficace. Poiché le aziende condividono sempre di più utilizzando i video, il tempo sprecato non potrà che peggiorare senza una soluzione di ricerca video.

Ecco perché oggi sempre più piattaforme video stanno ampliando le loro funzionalità di ricerca video. Tuttavia, man mano che il campo delle soluzioni si espande, diventa sempre più difficile per le organizzazioni orientarsi. Perché? Perché non tutti i motori di ricerca video sono creati uguali.

Forrester Research ha recentemente elogiato Panopto per il suo "miglior supporto per la ricerca video". È facile capire perché: nessuno va più in profondità o più in generale di Panopto quando si tratta di ricerca video, come mostrato nel grafico seguente.

Grafico delle capacità dei motori di ricerca video 2015

Se vale la pena registrare e archiviare un video, vale la pena trovarlo. Vuoi delle funzionalità di ricerca video che siano all'altezza di questo compito. Le moderne piattaforme video stanno trovando modi creativi per indicizzare i contenuti all'interno dei video, trovando nuovi modi per catturare metadati, input audio e contenuti visivi.

Calcolo dei risparmi

Quali capacità deve avere un motore di ricerca video?

Fondamentalmente, se uno strumento di ricerca video deve indicizzare i tuoi video, deve essere in grado di trovare e restituire tutte le parole pronunciate e mostrate sullo schermo.

Sebbene esistano diverse strategie tecniche per ottenere queste informazioni, esse tendono a dividersi in due gruppi: automatizzate o manuali.

Indicizzazione automatica dei video tramite ASR e OCR

L'indicizzazione automatica dei video si basa su una o più tecnologie video intelligenti per catturare e discernere ciò che accade nei video. Questi strumenti automatizzati possono spesso essere applicati a un video nel momento stesso in cui la registrazione viene completata, accelerando il processo di indicizzazione dei contenuti.

I comuni sistemi di indicizzazione automatica dei video includono il riconoscimento vocale automatico (ASR), il riconoscimento ottico dei caratteri (OCR) e l'ingestione di contenuti di diapositive. Questi tre sistemi fanno cose molto diverse, quindi analizziamoli più da vicino.

  • Riconoscimento vocale automatico (ASR) è una tecnologia utilizzata per identificare ogni parola pronunciata in una registrazione. Una volta identificate, le parole vengono marcate temporalmente e aggiunte a un indice di ricerca. Gli utenti possono quindi cercare le parole pronunciate, trovare il momento preciso del video in cui sono state menzionate e andare avanti velocemente fino a quel punto del video. Poiché molti spettatori cercheranno un momento in base a un'idea o a una frase che ricordano, l'ASR è una parte incredibilmente utile del motore di ricerca video.
  • Riconoscimento ottico dei caratteri (OCR) è una tecnologia utilizzata per riconoscere il testo visualizzato sullo schermo all'interno dei video. Spesso, nelle presentazioni moderne, un oratore passa dalle diapositive ai contenuti live sullo schermo e persino ad altri video. Senza l'OCR, qualsiasi testo mostrato come parte di queste presentazioni non può essere indicizzato perché i motori di ricerca come Google non possono riconoscere il testo salvato come immagine. La tecnologia OCR, invece, è progettata per identificare e decifrare queste parole, consentendo agli spettatori di cercare letteralmente qualsiasi parola appaia sullo schermo in qualsiasi punto del video.
  • Ingestione dei contenuti delle diapositive si riferisce alla tecnologia che importa e indicizza le diapositive della presentazione PowerPoint o Keynote quando vengono utilizzate nel video. L'inserimento dei contenuti si differenzia dall'OCR in quanto estrae programmaticamente le stringhe di testo effettive dalle diapositive, anziché scattare una foto della diapositiva e cercare di identificare le parole. L'inserimento delle diapositive estrae anche informazioni aggiuntive che non vengono visualizzate sullo schermo, come le note dell'oratore, in modo che il team possa sempre trovare momenti precisi nel video in base a qualsiasi parola contenuta in qualsiasi diapositiva.

Indicizzazione manuale dei video

L'indicizzazione manuale dei video, invece, si basa sull'intervento umano che avviene dopo che il video è stato completato per contribuire all'indicizzazione dei contenuti video.

L'utilità dei processi di indicizzazione manuale varia in base alla quantità di informazioni che possono aggiungere. Alcuni processi sono abbastanza completi, altri molto più limitati. Diamo un'occhiata ai due ingressi manuali più comuni:

  • Metadati manuali si riferisce alle informazioni aggiunte a un file video come titolo, autore e descrizione. Qui si possono aggiungere anche note e commenti degli spettatori. Questi sono una parte fondamentale della ricerca video, ma per i video aziendali - che spesso durano 30-60 minuti o più e coprono una serie di argomenti - i metadati manuali non forniscono quasi mai una descrizione sufficiente per essere utili da soli.
  • Le trascrizioni sono un approccio più completo, realizzato semplicemente aggiungendo una trascrizione video effettiva ai file video per l'indicizzazione. La produzione di trascrizioni è un settore in continua evoluzione: mentre molti servizi producono ancora questi file manualmente, il processo può essere automatizzato. In ogni caso, la qualità dell'input è essenziale: le trascrizioni complete saranno più preziose di quelle parziali e le trascrizioni che includono anche note sui contenuti mostrati sullo schermo saranno più preziose di quelle che recitano solo il dialogo.

Cos' è meglio per la ricerca video: l'indicizzazione automatica o manuale?

La scelta dipende dalle vostre esigenze. I sistemi di indicizzazione automatica basati sulla tecnologia offrono risultati più rapidi e spesso possono essere applicati a tutti i video, ma la precisione non è del 100% con ASR e OCR. Gli approcci manuali, basati sull'uomo, come la trascrizione, offrono in genere una maggiore accuratezza, ma richiedono più tempo per la produzione e spesso comportano un costo aggiuntivo.

Fortunatamente, con Panopto non dovrai scegliere.

La tecnologia di ricerca video Smart Search di Panopto è  il motore di ricerca video interno  più completo del settore. Con Panopto, potrai cercare nella tua videoteca nello stesso modo in cui cercheresti in Internet o per e-mail.

  • In base a qualsiasi parola chiave pronunciata nei video, con ASR
  • Da qualsiasi parola che appaia sullo schermo o in qualsiasi altro punto del video, con l'OCR e l'inserimento dei contenuti delle diapositive,
  • Con metadati tradizionali e avanzati, tra cui tag e titoli, note e commenti degli spettatori,
  • E, facoltativamente, con trascrizioni manuali complete dei vostri contenuti video.

Prova tu stesso il nostro motore di ricerca video!

Siete pronti a vedere cosa manca alla vostra ricerca video? Contatta il nostro team oggi stesso per programmare una demo.