Rubik un cubo per Robot

Rubik un cubo

Rubik un cubo anche per Robot

Rubik un cubo per mani robotiche, perché proprio la mano di un robot ha imparato da sola a risolverlo, dopo aver creato un proprio schema.
Rubik un cubo robotico grazie ai ricercatori di OpenAI che hanno sviluppato un nuovo metodo per trasferire abilità di manipolazione complesse da ambienti simulati a quelli fisici.
Rubik un cubo e un passo indietro al 2018 OpenAI, quando il laboratorio di ricerca sull’intelligenza artificiale con sede a San Francisco, aveva annunciato di aver addestrato una mano robotica a manipolare un cubo con notevole destrezza; avrebbe potuto non sembrare una grande notizia, ma nel mondo dell’intelligenza artificiale fu invece importante per due motivi:

  • la mano aveva imparato da sola come giocherellare con il cubo utilizzando un cosiddetto algoritmo di apprendimento per rinforzo, una tecnica modellata sul modo in cui gli animali apprendono la manualità;
  • tutto l’addestramento, che si era svolto in un ambiente simulato, è riuscito successivamente a trasporsi con successo nel mondo reale.
    Rubik un cubo e un passo importante verso robot più agili per applicazioni industriali e di consumo, perché Dactyl, questo il nome del robot che ha imparato a risolvere il cubo di Rubik con una mano, lo ha fatto attraverso una nuova procedura di apprendimento con un nuovo livello di simulazione che ha richiesto un nuovo livello di destrezza, considerato che il tipo di manipolazione necessaria per ruotare le parti del cubo Rubikiano è in realtà molto più difficile che ruotare un semplice cubo; e non è tutto, visto che, durante i test Dactyl ha risolto con successo il cubo più famoso del mondo anche in circostanze impreviste.

Rubik un cubo e una premessa: va detto che tradizionalmente, i robot sono stati in grado di manipolare gli oggetti solo in modi molto semplici e, mentre gli algoritmi di apprendimento per rinforzo hanno riscontrato un grande successo nel realizzare compiti complessi nel software, per esempio battere il miglior giocatore umano nell’antico gioco del Go o anche degli Scacchi, come nel caso di Deep Blue, usarli per addestrare una macchina fisica è stata una storia diversa; ciò in quanto gli algoritmi devono perfezionarsi attraverso tentativi ed errori, in molti casi attraverso milioni di cicli e quindi, probabilmente ci vorrebbe troppo tempo e molta usura per un robot fisico per farlo nel mondo reale; ma non solo: potrebbe anche essere pericoloso se il robot si muovesse senza apparente controllo per raccogliere dati.

Per evitare ciò, i roboticisti usano la simulazione: costruiscono un modello virtuale del loro robot e lo addestrano virtualmente a svolgere il compito da svolgere. L’algoritmo quindi apprende nella sicurezza dello spazio digitale e può essere successivamente portato in un robot fisico. Ma si tratta di un processo che deve affrontare delle sfide, in quanto è quasi impossibile costruire un modello virtuale che replichi esattamente tutte le stesse leggi della fisica, proprietà dei materiali e comportamenti di manipolazione visti nel mondo reale, per non parlare di circostanze inaspettate. Pertanto, più il robot e il compito sono complessi, più difficile è applicare un algoritmo addestrato virtualmente nella realtà fisica.

La chiave del successo di Dactyl è stata che il laboratorio ha rimescolato le condizioni simulate in ogni ciclo di allenamento per rendere l’algoritmo più adattabile alle diverse possibilità; per esempio, è stata cambiata la gravità e anche modificata anche la direzione in cui punta la gravità e, in definitiva, si è tentato di costruire una strategia che fosse operativa in modo affidabile con tutte queste modifiche della simulazione e così l’algoritmo ha finito per funzionare nel vero robot.

Rubik un cubo e ulteriori passo avanti: se in precedenza, i ricercatori dovevano randomizzare i parametri nell’ambiente selezionando manualmente le condizioni che avrebbero portato a un algoritmo migliore, attualmente il sistema di allenamento lo fa da solo e quindi, ogni volta che il robot raggiunge un certo livello di padronanza nell’ambiente esistente, il simulatore modifica i propri parametri per rendere le condizioni di allenamento ancora più difficili.

Il risultato?  Un algoritmo ancora più evoluto che può muoversi con la precisione richiesta per ruotare un cubo di Rubik nella vita reale. Attraverso i test, i ricercatori hanno scoperto che Dactyl ha anche risolto con successo il cubo in varie condizioni su cui non era stato addestrato. Per esempio, è stato in grado di completare il compito indossando un guanto di gomma, tenendo alcune dita legate insieme e mentre veniva pungolato da una giraffa di peluche.

I tecnici di OpenAI, in definitiva, ritengono che gli ultimi risultati forniscano una forte evidenza che il loro approccio sbloccherà robot meno specializzati e in grado di adattarsi in ambienti aperti come una cucina di casa, ciò in quanto il cubo di Rubik è uno degli oggetti rigidi più complicati in circolazione, di conseguenza questo approccio consentirà un grande sviluppo della robotica.
Ma attenzione, ammoniscono, a pensare che ci sia una teoria o un sistema unificato, perché quello del cubo è un compito isolato; se è vero che da una parte ci sono componenti comuni, dall’altra c’è anche un’enorme quantità di ingegneria necessaria per far funzionare ogni nuova attività; rischia, pertanto, di risultare fuorviante, pensare che Dactyl sia un robot per tutti gli usi, perché si tratta, in realtà, di  sistema molto specifico pensato per un’applicazione specifica.

Parte del problema, secondo i tecnici dell’organizzazione no profit con sede nelle città californiana culla di Philip Kindred Dick, alias papà del Rapporto di Minoranza e/o dei Rapporti di Minoranza, è l’apprendimento per rinforzo stesso. Va ricordato come, per natura, la tecnica sia progettata per padroneggiare un’azione particolare, con una certa flessibilità per gestire le variazioni, mentre nel mondo reale, il numero di potenziali variazioni si estende oltre ciò che può essere ragionevolmente simulato; in un’attività di pulizia, per esempio, ci potrebbero essere diversi tipi di stracci, di detersivi, di pavimenti ecc.

L’apprendimento per rinforzo è progettato anche per apprendere nuove capacità in gran parte da zero, ma ciò non è né efficiente nella robotica né rispecchia il modo in cui gli umani apprendono; per esempio, se a un essere umano capace di destreggiarsi, e che magari non hai mai mescolato qualcosa con un cucchiaio, non è necessario insegnare di nuovo tutto il tuo controllo motorio da capo.

Rubik un cubo e un ulteriore step: per andare oltre le limitazioni di cui sopra, sarà necessario usare altre tecniche di robotica più tradizionali, vedi processi di apprendimento, probabilmente per rinforzo, alla fine della giornata.

Fonte dalla quale è liberamente tradotto il presente testo:

https://www.technologyreview.com/2019/10/15/75292/a-robot-hand-taught-itself-to-solve-a-rubiks-cube-after-creating-its-own-training-regime/

 

Cubo di Rubik rompicapo universale

Scacchi che passione astronomica

Scacchi uomo-macchina (computer wins)

Il Rapporto di Minoranza (racconto parte I)

Rapporti di Minoranza (racconto parte II)

Altri spunti e idee su…

Calendario della Luna Verde

Photo by Luigi Viazzo – Huawei P8 Lite

Imparare la destrezza