czwartek, 1 sierpnia 2013

Stockfish 13073118 - pierwsze testy JCER wypadły bardzo dobrze


Stockfish - silnik szachowy UCI
 Autor kompilacji - Marco Costalba

Stockfish 13073118


2013.08.01 JCER Test Stockfish 13073118
RSilnikPktSt
1Stockfish 13073118 x6411.5/2011=1=0======1=====10
2Stockfish 13071917 x648.5/2000=0=1======0=====01


Temp: 3' + 3" Hardware: Pentium Dual-Core CPU T4300 @ 2.10GHz z 4,0 GB RAM  book: Perfect2012
system: Windows 7 64 bit games download (PGN File) Table created and GUI: Arena

Całkiem niedawno prezentowałam wyniki różnych wersji silnika Stockfish, gdzie bardzo wyraźnie zwyciężyła wersja Stockfish 13071917.
Nic więc dziwnego, że właśnie ona "sprawdziła" najnowszą kompilację 13073118. Okazało się, że wczorajsza kompilacja prezentuje się bardzo dobrze. Zastanawia mnie ten duży postęp w stosunku do oficjalnej wersji Stockfish 3 (który we wspomnianym turnieju zajął zasłużone, ostatnie miejsce). Jak tak dalej pójdzie to zmiana na czele list rankingowych wydaje się być kwestią czasu.

Wersje które prezentuje tutaj (w tym archiwalne) można również pobierać na stronie

9 komentarzy:

  1. Tylko ze wyniki na tym blogu są tak niestabilne że trudno przyjąć za pewnik że wersja Stockfish 13071917 jest najsilniejsza. Można przyjąć jedynie że w tym teście była najsilniejsza. A w kolejnym teście może ta byłaby ostania?

    OdpowiedzUsuń
    Odpowiedzi
    1. Z pewnością test złożony z 20-30 partii daje tylko orientacyjne wartości. Najlepszy byłby taki złożony z 500 i więcej partii co przy tempie 3' + 3" daje co najmniej tydzień gry 24 godziny na dobę.
      Zachęcam do zrobienia takiego testu, podesłania partii, z pewnością zamieszczę wyniki.

      Usuń
  2. Tu nie chodzi o ilość partii, można zauważyć ze na blogu nie raz nie dwa sa sprzeczne komunikaty o sile programów. Raz w testach wygrywa Houdini po czym następnym razem ląduje na 6 miejscu.W kolejnym teście wygrywa Stockfish by w następnym wyladowac pod koniec stawki.O wahaniach Rybki nawet nie wspomnę raz druga raz przedostania. Co do własnych testow i publikacji na blogu to miałoby sens tylko i wyłącznie gdybyśmy dysponowali podobna konfiguracja sprzętową w przeciwnym razie to bezsens. Jak wiadomo nawet
    niektóre aplikacje moja wpływ na działanie sprzętu np.popularne Adobe a co dopiero rodzaj i moc procesora. O zmianach napięciowych nawet nie będę wspominał,potem się wszyscy dziwią dlaczego dobry program wykonał w danym momencie "głupie"lub przegrywające posuniecie.Nikt nie monitoruje czy w danej partii ten czy inny program akurat nie wpadł w tzw zmienna napieciowa.

    OdpowiedzUsuń
    Odpowiedzi
    1. Własne testy zawsze mają sens, bo podaje się wtedy konfigurację sprzętową, na jakiej zostały zrobione. Wcale nie chodzi o to, by były to wyniki na identycznym sprzęcie w warunkach laboratoryjnych. Wystarczy bowiem (jak słusznie kolega zauważa, że w tle pracuje np. antywirus). Ja prowadzę testy na 3 (czasem nawet na 4) komputerach z inną konfiguracją - stąd czasem wyniki są zupełnie inne.
      Jeśli test trwa np 10 godzin, to nikt o zdrowych zmysłach nie będzie przecież siedział przy komputerze i zwracał uwagę czy np. w jakimś momencie nie włączy się choćby proces uaktualniania. Zapewniam, że nawet przy testach uchodzących za profesjonalne nikt tak nie robi.
      Natomiast wyniki przy małej ilości partii (a ja nie mam czasu jak pisałem na testy na np. 500 partii tempem 3+3) - zgodnie z rachunkiem prawdopodobieństwa zawsze wyjdą różne. Jednak przy obliczaniu rankingu po rozegraniu 300-500 partii obliczenia są bardzo miarodajne.

      Usuń
    2. Ano właśnie testy sa prowadzone na wielu komputerach o innej konfiguracji co wprowadza
      chaos w odbiorze wyników dla wielu obserwatorów bloga.
      Nie pisałem że własne testy nie mają sensu, wręcz przeciwnie każdy grający korespondencyjnie i" mierzący wysoko " czy to w MP lub MŚ musi takowe przeprowadzić na własnym sprzęcie nie tylko pod kątem siły gry ale również GUI i przeanalizować jak dany program radzi sobie w debiutach otwartych, zamkniętych itd. Co wymaga pewnego sterowania testem. Ale wątpię by ktokolwiek chciał się pochwalić swymi testami. A co do fragmentu " Zapewniam, że nawet przy testach uchodzących za profesjonalne nikt tak nie robi" sie zupełnie nie zgadzam mecz o MŚ Stockfish-Houdini był monitorowany pod tym kątem.A jak czesta jest to sprawa niech swiadczy fakt ze w moich testach z 10 ostatnich partii 3 musiałem powtórzyć wlasnie z tego powodu a mieszkam w domu jednorodzinnym.Aż strach pomyśleć co dzieje się w tzw blokowiskach

      Usuń
    3. Dziad swoje a baba swoje -:)
      cyt "Zapewniam, że nawet przy testach uchodzących za profesjonalne nikt tak nie robi" sie zupełnie nie zgadzam mecz o MŚ Stockfish-Houdini był monitorowany pod tym kątem."
      Proszę przeanalizować całą dyskusję i zwrócenie uwagi na kontekst wypowiedzi. Być może ten mecz (choć nie wiem na jakiej podstawie nazywany meczem o Mistrzostwo Świata) był monitorowany. Jednak testy na listach składające się z np. 1000 partii ze 100% pewnością nie!
      Co do wartości testów - to nie zgadzam się również z uwagami kolegi, pisałem o tym wielokrotnie. Zachęcam do własnych testów, włożenia w nie choć tyle czasu i pracy co ja wkładam. Z pewnością będą profesjonalne, wszechstronne i pozbawione chaosu -:)
      czego szczerze życzę

      Usuń
    4. Dziękuje za dobre rady! Zapewniam ze moje testy dla własnych potrzeb są profesjonalne wszechstronne i pozbawione chaosu. Sprawdzając program nie potrzeba rozgrywania 1000 i więcej partii lecz kilku. Szanując swój czas należy zrobić to właśnie profesjonalnie lub przynajmniej się starać. Publikowanie 1000 plew i bubli nikomu nic nie da. Praca i czas włozony w publikacje bubli jest czasem straconym. Ale rozumie ze to blog wiec chodzi
      o jak najwieksza ilość publikacji niekoniecznie sensownych zawsze trochę kasy można zarobić z reklam."Ciemny lud to kupi". A dlaczego był to mecz o MŚ, bo akurat te dwa programy awansowały do finału. Nie ja ustalałem nazewnictwo tego meczu

      Usuń
    5. Drogi kolego - anonimie rozśmieszył mnie kolega -:) dlatego cieszę się z tego komentarza, wszak śmiech to zdrowie.
      Ponadto nic kolega nie zrozumiał, mimo, że jak widać wszystkie rozumy zjadł!
      Tym niemniej życzę wszystkiego dobrego i zapraszam do dalszego komentowania i czytania bloga!
      Oczywiście, nie liczę na klikanie na reklamy ze strony kolegi, bo kokosy jakie z nich pochodzą są z pewnością powodem do zazdrości -:)

      Usuń
  3. Trzeba zacząć od tego że Stockfish jest silnkiem dosyć niestabilnym i prymitywnym w założeniu-głownie bazującym na głebokości przeszukiwania.Wielu testerów dało się wpuścić w kanał pogubili się w tych kompilacjach-Większośc z tych wersji nadaje się do wyrzucenia-grają różnie w zależności od humoru.

    OdpowiedzUsuń

Dziękuję za dodanie komentarza. Jeśli nie będzie zawierał wulgaryzmów lub słów obraźliwych zostanie wkrótce opublikowany.
Jurek

Szybki dostęp do około 3000 tysięcy silników szachowych

Niestety, dropbox generuje tak duży ruch, że przez chwilę zawiesili moje konto. W związku z tym będę umieszczał pliki na serwerze rapidu. Trzeba będzie poczekać :( Jeśli ktoś nie chce czekać wystarczy wpłacić przez PayPal równowartość 6$ podać swój adres email a otrzyma dostęp do folderu zawierające wszystkie silniki, które mam w kolekcji. Poniżej przycisk do PayPal