freelance

Jak Mercor ocenia jakość ewaluatorów, wyjaśnione

Sygnały, których Mercor używa do oceny jakości ewaluatorów, i co zrobić z każdym z nich, żeby wspiąć się po drabinie stawek.

Mercor placi ewaluatorom roznie w oparciu o wskaznik jakosci, ktory laczy kilka sygnalow. Zrozumienie kazdego pozwala optymalizowac tam, gdzie to ma znaczenie, i ignorowac szum. ## Sygnal 1: zgodnosc miedzy oceniajacymi W zestawach kalibracyjnych, gdzie istnieje ground truth lub gdzie wielu ewaluatorow ocenia ten sam artefakt, mierzony jest twoj wskaznik zgodnosci. Powyzej progu (zwykle wysokie 80-te do niskich 90-tych procent na wiekszosci sciezek) awansujesz; ponizej twoja stawka jest ograniczona. ## Sygnal 2: glebia uzasadnienia Ocena bez wyjasnienia dostaje minimalny kredyt, nawet jesli poprawna. Ocena z konkretnym, falsyfikowalnym uzasadnieniem ("druga odpowiedz pomija blad off-by-one w linii 14") dostaje pelny kredyt i odblokowuje wyzej platne partie. ## Sygnal 3: szybkosc odpowiedzi w rozsadnych granicach Szybsza akceptacja i ukonczenie zaproszen do zadan jest nagradzane. Trwala szybkosc powyzej ~24 godzin na zadanie srednio moze byc czerwona flaga oznaczajaca zbytni posp; system optymalizuje pod jakosc, a nie czysta szybkosc. ## Sygnal 4: wskaznik ukonczenia zadan Procent zaakceptowanych zadan, ktore faktycznie konczysz. Odrzucanie zadan po akceptacji szkodzi stawce; nieprzyjmowanie ich od poczatku jest neutralne. ## Sygnal 5: feedback od ludzkich recenzentow Okresowo czlowiek przeglada twoje ewaluacje i odnotowuje wzorce. Konstruktywna krytyka zastosowana w pozniejszej pracy podnosi twoj wskaznik. ## Co robic Czytaj kazda rubryke uwaznie przed pierwsza partia w nowej sciezce. Pisz uzasadnienia, jakby mial je czytac czlowiek (bo bedzie). Akceptuj tylko zadania, ktore mozesz czysto ukonczyc w terminie. Traktuj pierwsze 10 do 20 zadan w kazdej nowej sciezce jako okno kalibracji. ## Co cie usuwa Trwala zgodnosc miedzy oceniajacymi ponizej progu na wielu sciezkach. Uzasadnienia czytajace sie jak generowane przez LLM. Powtarzajace sie akceptowanie i porzucanie zadan.

Marketplace dla freelancerów

Zamień swoje umiejętności w dochód na Fiverr

Fiverr to najszybszy sposób, by zacząć sprzedawać usługi tech klientom na całym świecie. Utwórz ofertę w kilka minut, ustal własne ceny i otrzymuj zapłatę za kod, automatyzację, design i pracę z AI.

Zacznij sprzedawać na Fiverr →

Otrzymuj zapłatę od labów AI

Zarabiaj 30-100 USD/godz. oceniając wyniki modeli AI

Mercor łączy zweryfikowanych ekspertów (deweloperów, badaczy, specjalistów dziedzinowych) z płatną pracą oceniania dla czołowych labów AI. Asynchronicznie, zdalnie, wypłaty w USD. Idealne, jeśli masz głęboką wiedzę techniczną i chcesz elastyczny, dobrze płatny dochód dodatkowy.

Aplikuj do Mercor →

Często zadawane pytania

Jak Mercor wazy jakosc ewaluatora?

Kompozyt zgodnosci miedzy oceniajacymi, glebi uzasadnienia, wskaznika ukonczenia i feedbacku ludzkiego review. Zgodnosc miedzy oceniajacymi i glebia uzasadnienia to dwa najciezsze sygnaly.

Czy moge poprawic moja stawke Mercor bez zwiekszania godzin?

Tak. Wyzsza glebia uzasadnienia i konsekwentne przestrzeganie rubryki podnosza stawke bez zmiany wolumenu. Jakosc kumuluje sie; sama ilosc nie.