Leela Zero

User avatar
Dan.A
Posts: 464
Joined: Mon Jan 19, 2015 12:58 pm
Location: Bucuresti
Rang: 3Kyu

Re: Leela - software bazat pe retele neurale

Postby Dan.A » Tue Feb 20, 2018 1:38 am

Mic Update:

A aparut versiunea LeelaZ 12 cu autogtp 14 care poate fi gasita la acest link: https://github.com/gcp/leela-zero/releases

- La fel ca la versiunea precedenta , la prima rulare merge mai greu deoarece testeaza setarile.

- Apar multe imbunatatiri si optimizari legate de timp si imbunatatiri la cautare.

- Notabil la aceasta versiune este viteza. La mine cel putin versiunea trecuta lua la un net de 6x128 6.70 sec/mutare sa faca 1600 playouts acum ia 3.32.

- Planul nu sa modificat. Schimbari in "cursa" se vor face daca nu exista progres dupa 250k partide.

- Luna asta cel putin un nou network a promovat in medie cam odata la 2-3 zile. Cel mai mult fiind 139k partide pana la urmatoarea promovare.

- Ultimul network a inceput incet incet sa foloseasca si deschideri cu 3-4 spre deosebire de celelalte care deschid numa cu 4-4 si invazie in colt.

- Se pare ca GCP nu renunta inca la Leela originala. .
At some point I'll retire from running this project and will probably update regular Leela with the relevant stuff from this project.


- Pentru cine e interesat au inceput oamenii sa antreneze Networkuri de 20x256. Un rezultat poate fi vazut aici : https://github.com/gcp/leela-zero/issues/884 Poate fi rulat cu Leelaz. Este antrenat cu partide jucate de oameni. Am incercat si eu dar e de 6 ori mai incet pe placa mea decat cel de 6x128 si foloseste mai multe resurse.

- Alta stire notabila este ca GCP va fi prezent la congresul european de anul acesta
For what it's worth, I've been asked to do a keynote about advances in Computer Go (i.e. Leela Zero) at the European Go Congress this summer, so word will definitely spread among go players.

"There are times when the only choices you have left are the bad ones."

User avatar
MihaiL
Posts: 281
Joined: Mon Jan 19, 2015 12:24 pm
Rang: 2d

Leela Zero 0.12 - intrebare

Postby MihaiL » Tue Feb 20, 2018 9:17 pm

Dane (si Iulian) am si eu o intrebare: cum se poate seta timpul pe care AI-ul il dedica unei mutari ? In prezent sta cam 50 sec, ceea ce este boring daca-ti doresti blitz. Am incercat comanda time_settings, dar Sabaki nu o recunoaste (sau poate nu fac eu ceva corect). Multumesc.

User avatar
Admin
Site Admin
Posts: 401
Joined: Sat Jan 17, 2015 6:30 pm
Rang: 1d

Re: Leela - software bazat pe retele neurale

Postby Admin » Wed Feb 21, 2018 10:13 am

Stiu ca nici Leela nici Sabaki nu au suport pentru setarea timpului. In schimb se poate seta in GTP console din Sabaki.
Eu am testat cu time_settings 0 5 1 si apoi cu time_settings 0 50 1 si se pare ca le ia.
Primul numar e main time, al doilea e byo-yomi si al treilea numarul de pietre. Cu 0 ca main time intra in byo yomi direct si joaca o mutare la maxim x secunde.

Later Edit: ca o clarificare suplimentara. Nu merge sa fie precizate setarile de timp acolo unde se definesc engine-urile. Merge doar in consola GTP dupa ce porneste partida.
Iulian Lungu

User avatar
MihaiL
Posts: 281
Joined: Mon Jan 19, 2015 12:24 pm
Rang: 2d

Jucand cu Leela Zero 0.12 prin Sabaki [DETALII]

Postby MihaiL » Wed Feb 21, 2018 9:31 pm

Admin wrote:Stiu ca nici Leela nici Sabaki nu au suport pentru setarea timpului. In schimb se poate seta in GTP console din Sabaki.
Eu am testat cu time_settings 0 5 1 si apoi cu time_settings 0 50 1 si se pare ca le ia.
Primul numar e main time, al doilea e byo-yomi si al treilea numarul de pietre. Cu 0 ca main time intra in byo yomi direct si joaca o mutare la maxim x secunde.

Later Edit: ca o clarificare suplimentara. Nu merge sa fie precizate setarile de timp acolo unde se definesc engine-urile. Merge doar in consola GTP dupa ce porneste partida.


Multumesc. Minunat ! :D
Leela Zero mie imi pare suficient de tare deja (pentru mine = 1k slab, dar cred ca si mult peste mine, Dan ne poate spune din cercetarile lui cat de tare a ajuns, pentru ca eu din ELO-ul ala nu inteleg nimic). In plus pare sa consume resurse mult mai putine.

La ultimul punct din interventia ta te contrazic, insa, e un mic truc: trebuie sa scrii instructiunea de time setting (time_settings 0 10 1 de exemplu) cu o linie mai jos decat cea care incepe cu --gtp etc etc in Manage engines. Si va tine minte.

Uite de ex cum arata la mine:

[X] Leela Zero 0.12
[simbol folder]D:\IGO\Sabaki\.LEELA ZERO 0.12_AutoGTP\leelaz.exe
--gtp -w leelaz-model-4145159-96000.txt [asta e ultima retea, af9ce63c, de azi 21.02.18]
time_settings 0 10 1

Si merge brici. Mi-ai facut o bucurie. Pot juca o partida de Go pe seara fara fum si fara muzica :D

User avatar
Admin
Site Admin
Posts: 401
Joined: Sat Jan 17, 2015 6:30 pm
Rang: 1d

Re: Leela - software bazat pe retele neurale

Postby Admin » Wed Feb 21, 2018 9:51 pm

Ms Mihai pentru corectura. Se pare ca dupa comenzile pentru engine , in sabaki se pot specifica si comenzi pe care sa le execute in protocolul GTP.
Am mai aflat si eu ceva cu ocazia asta.

Ma bucur ca acum sunt intrunite elementele pentru o seara perfecta de Go :)

PS: si de la rangul meu care tot pe acolo e, am impresia ca LeelaZero a ajuns aproape de taria lui Leela11. Am observat ca pe KGS archive, userul LeelaZeroT a reusit sa castige la un robot de 5 dan de mai multe ori. La prima vedere cred ca pierde la el mai multe decat castiga, dar e pe acolo.
La cum merge antrenarea cred ca sunt sanse mari sa vedem LeelaZero la tarie de dan pro in cateva luni.
Iulian Lungu

User avatar
Dan.A
Posts: 464
Joined: Mon Jan 19, 2015 12:58 pm
Location: Bucuresti
Rang: 3Kyu

Re: Leela - software bazat pe retele neurale

Postby Dan.A » Fri Feb 23, 2018 5:29 pm

Dan ne poate spune din cercetarile lui cat de tare a ajuns, pentru ca eu din ELO-ul ala nu inteleg nimic). In plus pare sa consume resurse mult mai putine.


- Parerile sunt multiple in functie de placi si teste. Pentru ca sa nu conteze placa se poate folosi testarea cu Playouts fix Ex: (-noponder -p 1600). Dar GCP considera ca nu-s relevante deoarece fiecare program are alte metode de a efectua aceste playouts si recomanda setarile de timp.

Pe KGS intradevar are rezultate bune la 5d dar suspectez ca nu in conditii de Hardware egale. :)
Pe Fox Weiqi a ajuns la 4d si chiar castiga la 6D din diferite surse (eu nu am cont deci nu pot verifica personal)

- Eloul dupa site este un Elo intern care a suferit multe modificari si schimbari iar fara o ancora externa nu ii poate fi atribuit un rang corect.

- Un test obiectiv pe o placa Titan V a reusit din 27 de partide sa castige 2 cu leelaZ vs Leela 11.

- Din testele mele (pe calculatorul meu) la 10s/mutare ultimul network a reusit sa castige de 3 ori la 6h la Leela 11 si l-am trecut la 5h unde a facut egal. In schimb pe Ray 4.32 il cam bat ultimele network-uri la paritate.

- Alt lucru pe care l-am observat tot din teste personale (acum cu marirea vitezei si cu posibilitatea mai usoara de setat timpul se pot face teste mai usor) ca ultimele network-uri se cam bat in cerc. Fiecare probabil e mai bun la un alt aspect din partida. :)

Mic Update:

Testele cu networkul de 20x256 (de restinut ca sunt teste private si inca nu fac parte din proiect) antrenat cu partide de Tygem este interesant dar costisitor. Arhuvat are 98M si dezarhivat are 350M.

- Nici nu stau sa-mi imaginez cat ocupa fisierele de antrenament daca la un 5x64 ocupa cativa giga.

Citat din GCP
I actually killed the server trying to upload it.

Feeling pretty stupid right now. Lesson learned: we're not quite ready for a 256x20 run.


- Eu sper sa continue sa creasca acest 6x128 deoarece la pretutile exagerate rau la placi grafice in acest moment nu cred ca am sanse la un upgrade prea curand. Iar asta de 20x256 imi omoara placa existenta.

PS. Pentru cine foloseste sabaki pentru a testa network-uri intre ele sau se joaca. Dupa terminarea partidei cel putin la mine daca il las idle incepe sa consume nejustificat resurse si merge o perioada foarte incet. In rest nu am probleme.
"There are times when the only choices you have left are the bad ones."

User avatar
Admin
Site Admin
Posts: 401
Joined: Sat Jan 17, 2015 6:30 pm
Rang: 1d

Re: Leela - software bazat pe retele neurale

Postby Admin » Mon Feb 26, 2018 12:04 pm

GCP wrote:As you correctly anticipated and inferred, I cut learning rate to 0.00015 (which is "halfway" a 10x reduction) after we had 170k games without promotion. I also increased max steps to 256k and rejiggled the steps that will get matched a bit (but I made a mistake so the uploads this weekend stopped at 128k, now fixed).

I've started training 128x10's by using net2net to generate a network and then training it on the last 500k games.


Se pare ca au inceput sa se arate limitele retelei 128x6 si ca in curand se va trece pe o retea de 128x10.
Fata de reteaua 64x5 care ajunsese la ELO 6738, actuala retea va stagna probabil undeva in jurul lui ELO 8500.
Sper ca 128x10 sa ajunga la tarie de dan pro.
Iulian Lungu

User avatar
MihaiL
Posts: 281
Joined: Mon Jan 19, 2015 12:24 pm
Rang: 2d

Re: Leela - software bazat pe retele neurale

Postby MihaiL » Mon Feb 26, 2018 3:02 pm

Admin wrote:Sper ca 128x10 sa ajunga la tarie de dan pro.


Ma intreb [si va intreb :) ] daca exista/va exista vreo corespondenta, fie si vaga, intre acest "ELO intern" si taria de joc umana, a.i. sa putem si noi sti pe cine avem in fata.
Cred ca pana la urma tot "sistemul adevarului" = numarul de pietre handicap ramane criteriul.

O sa ajungem sa ne spunem rangurile la modul "Leela Zero -n" (unde n e handicapul). :)
Ma intreb (retoric) si daca va mai fi cineva pe la noi (apoi prin lumea larga) cu +n...

User avatar
Dan.A
Posts: 464
Joined: Mon Jan 19, 2015 12:58 pm
Location: Bucuresti
Rang: 3Kyu

Re: Leela - software bazat pe retele neurale

Postby Dan.A » Wed Feb 28, 2018 10:55 am

Ma intreb [si va intreb :) ] daca exista/va exista vreo corespondenta, fie si vaga, intre acest "ELO intern" si taria de joc umana, a.i. sa putem si noi sti pe cine avem in fata.


Momentan nu am idee. Pe OGS RoyalZero e cam 5D. Iar pe KGS cica ar fi ajuns 6, dar nu stiu numele contului.

- Poate acest Doc te va lamurii o leaca mai mult deoarece e singurul care incearca sa faca o conversie:
https://docs.google.com/spreadsheets/d/ ... =806323235

O sa ajungem sa ne spunem rangurile la modul "Leela Zero -n" (unde n e handicapul).


- Probabil si placa video folosita pe langa numarul de pietre handicap.

Eu de exemplu as avea alta idee. Cand robotul ajunge destul de tare , sa-ti analizeze o partida si sa-ti estimeze rangul in functie de analiza partidei.:) Poate fi antrenat pe partide de rang. EX: Iei x partide de 3D si le analizezi apoi 4D etc. si faci un scor estimativ pentru rangul respectiv.
"There are times when the only choices you have left are the bad ones."

User avatar
Admin
Site Admin
Posts: 401
Joined: Sat Jan 17, 2015 6:30 pm
Rang: 1d

Re: Leela - software bazat pe retele neurale

Postby Admin » Fri Mar 02, 2018 6:25 pm

jkiliani wrote:Since the bootstrap is a full blown success on the first try, can we simply do the switch to 10 blocks now? The new net looks great!

Primele teste cu o noua retea de 128x10 sunt impresionante. A batut vechea retea de 128x6 cu un procent de 76.47%. In eventualitatea in care se va trece la antrenarea acestei noi retele sunt curios cum va evolua.
Iulian Lungu


Return to “GO-ul si IT-ul/AI-ul”

Who is online

Users browsing this forum: No registered users and 1 guest

cron