TTA LLM 인증 시험 시스템

MediKoGPT 성능 평가 - TC1(진단명), TC2(진료과), TC3(토큰속도)

🐛 디버그 모드: OFF

데이터 현황

TC1, TC2
530건
TC3
1,125건

통합 제어

TC1: 진단명 예측 준비
측정 지표 Accuracy, F1-Score
데이터 수 530건
예상 목표 94% 이상
0%
대기 중...
TC2: 진료과 추천 준비
측정 지표 mAP
데이터 수 530건
예상 목표 92% 이상
0%
대기 중...
TC3: 토큰 생성 속도 준비
측정 지표 토큰 생성 시간
API 호출 1,125번
예상 목표 ≤ 1.8초/토큰
0%
대기 중...

📊 데이터 모니터 및 상세 보기

입력 데이터:

데이터를 선택하세요...

TC1 결과 (진단명):

예측: -
정답: -
일치: -

TC2 결과 (진료과):

예측: -
정답: -
일치: -

TC3 토큰 속도:

-
API 호출: 0
평균 속도: -

📈 평가 결과

TC1 Accuracy
-
TC1 F1-Score
-
TC2 mAP
-
TC3 토큰 속도
-

📝 실행 로그

시스템 준비 완료