News

Open source: Roboflow espande i set di dati per gli sviluppatori

Roboflow Universe, lanciato nell’agosto 2021, dispone ora di oltre 90.000 set di dati accessibili tramite API aperte, che includono oltre 66 milioni di immagini. L’obiettivo è quello di contribuire a ridurre al minimo la complessità e i bias

Pubblicato il 29 Giu 2022

Roboflow

Le librerie e i progetti di machine learning si basano sui dati per apprendere, addestrare e gestire. Per aiutare gli sviluppatori a beneficiare più facilmente di set di dati etichettati e modelli di apprendimento automatico per la visione artificiale, Roboflow ha annunciato un’espansione dei suoi set di dati e modelli di intelligenza artificiale come parte dell’iniziativa Roboflow Universe, che potrebbe essere uno dei più grandi repository open source disponibili. Roboflow afferma di avere oltre 90.000 set di dati che includono oltre 66 milioni di immagini nel servizio Roboflow Universe lanciato nell’agosto 2021.

Roboflow, fondata nel 2019, ha raccolto 20 milioni di dollari in un round di finanziamento di serie A nel settembre 2021; fornisce il repository universe open source di set di dati e modelli per la visione artificiale, nonché l’etichettatura dei dati, lo sviluppo di modelli e le funzionalità di hosting. Il modello di business di Roboflow è quello di fornire livelli di servizio gratuiti per gli utenti a livello base e quindi man mano che l’utilizzo cresce, o per quelle organizzazioni che lavorano con set proprietari, l’azienda fornisce supporto a pagamento e opzioni di servizio.

L’universo Roboflow non consiste semplicemente nel fornire immagini che uno sviluppatore può utilizzare; si tratta di fornire immagini curate in un approccio che consenta di utilizzare i set di dati per applicazioni basate sull’intelligenza artificiale.

“Un progetto è fondamentalmente qualcosa che contiene sia un set di dati che qualcuno potrebbe usare che un modello addestrato in cima a quel set di dati”, dichiara Joseph Nelson, co-fondatore e CEO.

Roboflow supporta l’esportazione di set di dati in 36 formati di annotazione di etichettatura dei dati. Tra i formati supportati ci sono COCO JSON, VOC XML e il formato YOLO Darknet TXT.

“Rendere i dati dell’immagine ampiamente disponibili e utilizzabili significa che qualcuno può immediatamente trovare un set di dati, inserirlo nella propria pipeline di addestramento e andare avanti”, spiega Nelson.

L’obiettivo di Roboflow è quello di contribuire a ridurre al minimo la complessità. I set di dati di Roboflow Universe sono accessibili tramite API aperte. Ad esempio, Roboflow ha un pacchetto Python ospitato sul Python Package Index (PyPI) che consente agli sviluppatori di estrarre a livello di programmazione immagini, annotazioni e modelli e quindi incorporare direttamente tali componenti in un’applicazione.

Roboflow Universe contro i bias

La distribuzione di un modello Roboflow Universe nei servizi di machine learning cloud più diffusi, tra cui AWS Sagemaker o Vertex di Google, è anche un’operazione semplice tramite una chiamata API. Inoltre, Roboflow rende disponibili set di dati e modelli come contenitori Docker, consentendo la distribuzione nei dispositivi perimetrali. C’è anche un kit di sviluppo software (SDK) per supportare anche i dispositivi Apple iOS.

Un altro impatto di avere un corpus così ampio di dati open source contribuisce a ridurre le preoccupazioni sui pregiudizi dell’AI (bias).

“Molti problemi di pregiudizio dell’AI derivano dalla sotto-rappresentazione”, commenta Nelson. “Il modo per correggere la sotto-rappresentazione è abilitare la raccolta attiva di set di dati della classe sottorappresentata e rendere tali dati accessibili, ricercabili e utilizzabili”.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati