DocMaster AI는 PDF·PPTX 파일을 업로드하면, 문서에서 텍스트와 표를 추출하고, 선택한 유형에 맞춰 보고서·개발 피처 목록·테스트 케이스 등을 자동 생성하는 서비스입니다.
flowchart TB
subgraph prep["시작 전"]
A["Key 설정
API 키 등록"]
end
subgraph step1["Step 1"]
B["PDF/PPTX 업로드"]
C["서버 추출 · 마크다운 변환"]
B --> C
end
subgraph step2["Step 2"]
D["문서 유형 선택"]
D --> E["기획서 기반 보고서"]
D --> F["개발 피처 목록"]
D --> G["테스트 케이스"]
E --> H["경영진/실무 · HTML 형식 선택"]
H --> I["보고서 생성"]
I --> J{"맞춤 질문
표시?"}
J -->|반영| K["정리 md 보강 후 HTML 생성"]
J -->|건너뛰기| L["HTML 생성"]
K --> L
F --> M["개발 피처 생성"]
G --> N["테스트 케이스 생성"]
end
subgraph result["결과"]
O["보고서 보기 · HTML/정리 md 다운로드"]
end
A --> B
C --> D
L --> O
M --> O
N --> O
그림 1. 서비스 전체 사용 흐름
보고서 생성은 외부 LLM(OpenAI, Anthropic, Google 등) API를 사용합니다. 반드시 우측 상단 [Key 설정]에서 API 키를 입력하고, 사용할 LLM을 선택해야 합니다.
그림 2. 메인 화면 상단 (Key 설정 버튼)
그림 3. 설정 모달 — API 키 화면
| 항목/버튼 | 동작 |
|---|---|
| 리포트 생성을 위한 LLM 선택 | 드롭다운. OpenAI(GPT-5.2/5.1), Anthropic(Claude 4.6 Sonnet / 4.5 Opus), Google(Gemini 3.1 Pro / 2.5 Pro) 중 선택. 선택한 제공업체와 동일한 API 키를 사용해야 합니다. |
| API Key (필수) | 선택한 LLM 제공업체에서 발급한 API 키를 입력합니다. 저장 시 Local Storage에만 저장됩니다. |
| 연결 확인 | 현재 선택한 LLM과 입력한 키로 API 호출을 시도해, 정상 동작 여부를 확인합니다. |
| 저장 및 적용 | LLM 선택 값과 API 키를 저장하고 모달을 닫습니다. 이후 보고서 생성 시 이 설정이 사용됩니다. |
| ✕ (닫기) | 설정을 저장하지 않고 모달만 닫습니다. |
메인 화면 중앙의 업로드 영역에 PDF 또는 PPTX 파일을 드래그 앤 드롭하거나, 영역을 클릭해 파일을 선택합니다.
그림 4. Step 1 — 업로드 영역
| 동작 | 설명 |
|---|---|
| 영역 클릭 | 파일 선택 대화상자가 열립니다. PDF/PPTX를 선택하면 즉시 업로드·파싱이 시작됩니다. |
| 드래그 앤 드롭 | 파일을 업로드 영역 위에 놓으면 동일하게 업로드·파싱이 시작됩니다. |
| API 키 미등록 시 | Key 설정이 되어 있지 않으면 업로드 시도 시 토스트로 "API 키 등록이 필요합니다" 안내가 나오고, [Key 설정 열기] 또는 [도움말 보기]를 선택할 수 있습니다. |
파싱이 진행되는 동안 "파이썬 서버가 문서를 추출 중입니다..." 메시지와 로딩 표시가 나타납니다. 완료되면 Step 2 영역이 나타납니다.
추출이 끝나면 Step 1 완료 배너와 추출 콘텐츠 미리보기, 그 아래 「어떤 문서를 만들까요?」 카드 3종이 표시됩니다.
그림 5. 문서 유형 선택 카드
| 카드 | 용도 | 생성 버튼 |
|---|---|---|
| 기획서 기반 보고서 | 기획서·제안서 PDF/PPTX를 경영진용 또는 실무용 보고서로 정리합니다. 경영진용은 핵심 리스크·결론 중심, 실무용은 담당자·일정·액션 중심입니다. | 아래에서 경영진/실무, HTML 형식, 고품질 선택 후 [보고서 생성] |
| 개발 피처 목록 | 카테고리별 개발 피처·요건 목록을 생성합니다. | [개발 피처 생성] |
| 테스트 케이스 | 영역별·단계별·예상 결과가 있는 QA용 테스트 케이스 문서를 생성합니다. | [테스트 케이스 생성] |
각 카드의 [프롬프트 편집] 버튼을 누르면 해당 유형의 프롬프트(역할·규칙·Step)를 편집할 수 있습니다. 저장한 내용은 다음 생성부터 적용됩니다.
그림 6. Step 2 — 보고서 옵션 및 생성 버튼
| 항목/버튼 | 동작 |
|---|---|
| ✅ Step 1 완료 — 문서 추출 결과 | 파싱된 파일명과 줄 수가 표시됩니다. |
| 🔄 다른 파일 분석 | 클릭 시 업로드 화면으로 돌아가 새 파일을 선택할 수 있습니다. 현재 추출 결과와 보고서는 초기화됩니다. |
| 추출 콘텐츠 미리보기 | 추출된 마크다운 앞부분을 제한된 높이로 보여줍니다. 더 많은 줄은 "다운로드 후 확인"으로 안내됩니다. |
| 📥 추출 결과 다운로드 (.md) | 추출된 전체 마크다운을 파일명_extracted.md로 브라우저에서 즉시 다운로드합니다. 서버 요청 없음. |
| 보고용 (경영진·리더십 대상) / 실무 공유용 (팀 협업·액션 플랜) | 탭 형태. 선택한 쪽이 보고서 생성 시 사용되는 프롬프트와 출력 스타일을 결정합니다. 경영진용은 핵심 리스크·결론 중심, 실무용은 담당·일정·액션 중심입니다. |
| HTML 형식 | 드롭다운. 기획/제안서 스타일, 프레젠테이션 스타일, 프리포맷 3종 중 선택. 같은 보고 유형에서 이미 정리 md가 생성된 상태라면 형식만 바꿔 [보고서 생성]을 다시 누르면 정리 md는 재사용되고 선택한 형식으로만 HTML이 다시 만들어집니다. |
| 고품질 체크박스 | 선택 시 N회차(최대 3회) 검토로 품질을 높입니다. LLM 호출이 2~3회 추가되어 비용과 시간이 늘어납니다. |
| 📄 보고서 생성 | 선택한 옵션(경영진/실무, HTML 형식, 고품질)으로 1단계: 정리 md 생성 후, 맞춤 질문이 생성되면 의도 반영 단계(아래 4.1)를 거친 뒤 2단계: HTML 생성을 진행합니다. 질문이 없거나 건너뛰면 곧바로 HTML이 생성됩니다. 생성 중에는 로딩 팝업이 표시되며, 완료 후 토큰·비용은 정리 md + HTML 생성 합산으로 표시됩니다. |
생성이 완료되면 "보고서 생성이 완료되었습니다." 메시지와 함께 토큰 사용량(정리 md + HTML 생성 합산) 및 예상 비용이 표시되고, [만들어진 보고서 보기], 정리 내용 (.md) 다운로드 버튼이 나타납니다. 표시되는 토큰·비용은 1단계(정리 md)와 2단계(HTML 생성)의 합산입니다.
HTML 생성이 실패한 경우: 2단계(HTML 변환)에서 오류가 나도 1단계에서 생성된 정리 md가 있으면 해당 내용은 유지·표시되며, 「정리 내용 (.md) 다운로드」로 받을 수 있습니다. 이때 "HTML 보고서 생성에 실패했습니다. 정리된 내용(.md)은 아래에서 다운로드할 수 있습니다." 안내가 표시됩니다.
기획서 기반 보고서를 선택하고 [보고서 생성]을 누르면, 정리 초안이 만들어진 뒤 「맞춤 질문」 팝업이 뜨는 경우가 있습니다. 초안 내용을 바탕으로 "어떤 포인트를 강조·구체화할지" 2~3개의 다지선다 질문이 표시됩니다.
그림 6-1. 맞춤 질문 모달
| 버튼/동작 | 설명 |
|---|---|
| 각 질문의 선택지 | 라디오 버튼 형태. 원하는 선택지를 하나씩 고르면 "반영하여 계속" 버튼이 활성화됩니다. |
| 건너뛰기 | 질문에 답하지 않고 초안 그대로 최종 HTML을 생성합니다. 로딩 후 보고서 보기로 넘어갑니다. |
| 반영하여 계속 | 모든 질문에 답한 뒤에만 클릭 가능합니다. 선택한 항목을 반영해 정리 md를 한 번 더 수정한 뒤, 그 결과로 HTML을 생성합니다. 의도에 맞게 강조·구체화된 보고서가 만들어집니다. |
| ✕ (닫기) | 건너뛰기와 동일하게 동작합니다. 초안 그대로 HTML이 생성됩니다. |
[만들어진 보고서 보기]를 누르면 생성된 HTML 보고서가 팝업(또는 전체 화면)으로 표시됩니다. 보고서 HTML 안에 Mermaid 다이어그램 코드가 있으면 자동으로 다이어그램으로 렌더됩니다. HTML 생성이 실패했지만 정리 md가 있는 경우에는 해당 정리 md가 뷰어에 표시되거나, Step 2 패널에서 「정리 내용 (.md) 다운로드」로 받을 수 있습니다. 모델이 요청을 거절한 경우에는 안내 메시지와 함께 정리 md 다운로드가 권장됩니다.
그림 7. 보고서 뷰어
| 버튼 | 동작 |
|---|---|
| HTML 다운로드 | 현재 보고서 HTML이 있을 때 DocMaster_Report.html 파일로 다운로드합니다. HTML 생성이 실패해 정리 md만 있는 경우에는 이 버튼이 없을 수 있습니다. |
| 닫기 (✕) / 새 문서 분석하기 | 뷰어를 닫고 이전 화면(Step 2)으로 돌아갑니다. 보고서는 유지되며 다시 [만들어진 보고서 보기]로 볼 수 있습니다. |
Step 2 패널에서 정리 내용 (.md) 다운로드를 누르면, LLM이 생성한 정리 마크다운이 파일명_report.md로 다운로드됩니다.
「어떤 문서를 만들까요?」 카드에서 [프롬프트 편집]을 누르면, 해당 유형(기획서 기반 보고서 / 개발 피처 / 테스트 케이스)의 프롬프트를 편집하는 모달이 열립니다.
그림 8. 프롬프트 편집 모달 (보고서 유형)
| 항목/버튼 | 동작 |
|---|---|
| 경영진용 / 실무용 탭 | 보고서 유형일 때만 표시됩니다. 탭을 전환하면 해당 용도의 프롬프트(편집 가능 + 자동 적용)가 표시됩니다. |
| 기본값으로 초기화 | 현재 탭의 편집 가능 프롬프트를 서비스 기본값으로 되돌립니다. 저장하기 전까지는 반영되지 않습니다. |
| 취소 | 변경 사항을 저장하지 않고 모달을 닫습니다. |
| 저장 및 적용 | 편집한 내용을 Local Storage에 저장하고 모달을 닫습니다. 다음 보고서/피처/테스트 케이스 생성부터 적용됩니다. |
우측 상단 [템플릿 관리]를 누르면 HTML 템플릿(기획/제안서 스타일, 프레젠테이션 스타일, 프리포맷, 테스트 케이스, 개발 피처)을 확인·관리할 수 있습니다. 기획서 기반 보고서용은 스타일 가이드 기반으로 LLM이 HTML 전체를 생성합니다. 테스트 케이스·개발 피처용 템플릿은 API에서 불러오며, API가 없거나 404일 때는 앱 내 기본값이 사용됩니다.
그림 9. 템플릿 관리
자세한 내용은 docs/07-html-template-handling-ko.md를 참고하세요.
| 항목 | 내용 |
|---|---|
| 파일 보관 | 업로드한 PDF/PPTX는 추출 완료 후 즉시 삭제되며, 서버에 원본을 보관하지 않습니다. |
| API 전송 | 보고서 생성 시 추출된 텍스트·표 등만 선택한 LLM 제공업체(OpenAI, Anthropic, Google 등) API로 전송됩니다. 원본 파일 자체는 전송되지 않습니다. |
| 설정 저장 | API 키, LLM 선택, 프롬프트 편집 내용은 브라우저 Local Storage에만 저장됩니다. 서버에 설정을 보내지 않습니다. |
| 다운로드 | 추출 결과(.md), 정리 내용(.md), HTML 보고서는 브라우저에서 생성·다운로드되며, 서버에 보고서 파일을 저장하지 않습니다. |
— DocMaster AI 사용자 메뉴얼 (HTML) —