feat: enhance receipt import to support PDF files with updated UI and backend processing

This commit is contained in:
Nils-Johan Gynther
2026-04-16 20:22:27 +02:00
parent a12abe0402
commit b8744f625b
3 changed files with 95 additions and 16 deletions
@@ -16,6 +16,7 @@ const ALLOWED_MIMES = [
'image/webp', 'image/webp',
'image/heic', 'image/heic',
'image/heif', 'image/heif',
'application/pdf',
]; ];
@Controller('receipt-import') @Controller('receipt-import')
@@ -37,7 +38,7 @@ export class ReceiptImportController {
} }
if (!ALLOWED_MIMES.includes(file.mimetype)) { if (!ALLOWED_MIMES.includes(file.mimetype)) {
throw new BadRequestException( throw new BadRequestException(
'Otillåten filtyp. Använd JPEG, PNG eller WebP.', 'Otillåten filtyp. Använd JPEG, PNG, WebP eller PDF.',
); );
} }
return this.receiptImportService.parseReceipt(file); return this.receiptImportService.parseReceipt(file);
@@ -4,11 +4,13 @@ import {
Logger, Logger,
ServiceUnavailableException, ServiceUnavailableException,
} from '@nestjs/common'; } from '@nestjs/common';
import * as pdfParse from 'pdf-parse';
import { PrismaService } from '../prisma/prisma.service'; import { PrismaService } from '../prisma/prisma.service';
import { ParsedReceiptItem } from './dto/parsed-receipt-item.dto'; import { ParsedReceiptItem } from './dto/parsed-receipt-item.dto';
const MISTRAL_API_URL = 'https://api.mistral.ai/v1/chat/completions'; const MISTRAL_API_URL = 'https://api.mistral.ai/v1/chat/completions';
const PROMPT = `Du är en kvittoläsare. Analysera detta kvitto och returnera ENDAST en JSON-array med alla köpta varor.
const IMAGE_PROMPT = `Du är en kvittoläsare. Analysera detta kvitto och returnera ENDAST en JSON-array med alla köpta varor.
Varje vara ska ha följande fält: Varje vara ska ha följande fält:
- "rawName": varans namn som det står på kvittot (sträng) - "rawName": varans namn som det står på kvittot (sträng)
- "quantity": antal eller mängd som ett tal (t.ex. 1, 2, 0.5) - "quantity": antal eller mängd som ett tal (t.ex. 1, 2, 0.5)
@@ -17,6 +19,19 @@ Varje vara ska ha följande fält:
Returnera BARA JSON-arrayen utan markdown-formatering.`; Returnera BARA JSON-arrayen utan markdown-formatering.`;
const TEXT_PROMPT = (text: string) =>
`Du är en kvittoläsare. Nedan följer rå text från ett kvitto. Analysera texten och returnera ENDAST en JSON-array med alla köpta varor.
Varje vara ska ha följande fält:
- "rawName": varans namn som det står på kvittot (sträng)
- "quantity": antal eller mängd som ett tal (t.ex. 1, 2, 0.5)
- "unit": enhet — välj ett av: "st", "kg", "g", "l", "dl", "cl", "ml", "förp", "pak", "burk", "flaska"
- "price": pris i SEK som ett tal, eller null
Returnera BARA JSON-arrayen utan markdown-formatering.
Kvittotext:
${text}`;
@Injectable() @Injectable()
export class ReceiptImportService { export class ReceiptImportService {
private readonly logger = new Logger(ReceiptImportService.name); private readonly logger = new Logger(ReceiptImportService.name);
@@ -31,9 +46,20 @@ export class ReceiptImportService {
); );
} }
const base64 = file.buffer.toString('base64'); const isPdf = file.mimetype === 'application/pdf';
const mimeType = file.mimetype || 'image/jpeg'; const rawItems = isPdf
? await this.parseReceiptFromPdf(file.buffer, apiKey)
: await this.parseReceiptFromImage(file.buffer, file.mimetype, apiKey);
return this.matchProducts(rawItems);
}
private async parseReceiptFromImage(
buffer: Buffer,
mimeType: string,
apiKey: string,
): Promise<ParsedReceiptItem[]> {
const base64 = buffer.toString('base64');
const response = await fetch(MISTRAL_API_URL, { const response = await fetch(MISTRAL_API_URL, {
method: 'POST', method: 'POST',
headers: { headers: {
@@ -50,7 +76,7 @@ export class ReceiptImportService {
type: 'image_url', type: 'image_url',
image_url: { url: `data:${mimeType};base64,${base64}` }, image_url: { url: `data:${mimeType};base64,${base64}` },
}, },
{ type: 'text', text: PROMPT }, { type: 'text', text: IMAGE_PROMPT },
], ],
}, },
], ],
@@ -59,6 +85,50 @@ export class ReceiptImportService {
}), }),
}); });
return this.extractItemsFromMistralResponse(response, 'bild');
}
private async parseReceiptFromPdf(
buffer: Buffer,
apiKey: string,
): Promise<ParsedReceiptItem[]> {
let pdfText: string;
try {
const parsed = await pdfParse(buffer);
pdfText = parsed.text?.trim();
} catch {
throw new BadRequestException('Kunde inte läsa PDF-filen. Kontrollera att filen inte är skadad.');
}
if (!pdfText || pdfText.length < 20) {
throw new BadRequestException(
'PDF-filen verkar inte innehålla läsbar text. Prova att fotografera kvittot istället.',
);
}
this.logger.log(`PDF-text extraherad (${pdfText.length} tecken)`);
const response = await fetch(MISTRAL_API_URL, {
method: 'POST',
headers: {
'Content-Type': 'application/json',
Authorization: `Bearer ${apiKey}`,
},
body: JSON.stringify({
model: 'mistral-small-latest',
messages: [{ role: 'user', content: TEXT_PROMPT(pdfText) }],
max_tokens: 2000,
temperature: 0.1,
}),
});
return this.extractItemsFromMistralResponse(response, 'PDF');
}
private async extractItemsFromMistralResponse(
response: Response,
source: string,
): Promise<ParsedReceiptItem[]> {
if (!response.ok) { if (!response.ok) {
const err = await response.text(); const err = await response.text();
this.logger.error(`Mistral API svarade ${response.status}: ${err}`); this.logger.error(`Mistral API svarade ${response.status}: ${err}`);
@@ -70,19 +140,17 @@ export class ReceiptImportService {
}; };
const content = data.choices?.[0]?.message?.content ?? '[]'; const content = data.choices?.[0]?.message?.content ?? '[]';
let rawItems: ParsedReceiptItem[];
try { try {
const clean = content.replace(/```(?:json)?/gi, '').trim(); const clean = content.replace(/```(?:json)?/gi, '').trim();
rawItems = JSON.parse(clean); const items = JSON.parse(clean);
if (!Array.isArray(rawItems)) throw new Error('Inte en array'); if (!Array.isArray(items)) throw new Error('Inte en array');
return items as ParsedReceiptItem[];
} catch { } catch {
this.logger.error('Kunde inte parsa Mistral-svar:', content); this.logger.error(`Kunde inte parsa Mistral-svar (${source}):`, content);
throw new BadRequestException( throw new BadRequestException(
'Kvittot kunde inte tolkas. Försök med en tydligare bild.', `Kvittot kunde inte tolkas. Försök med en tydligare ${source === 'PDF' ? 'PDF' : 'bild'}.`,
); );
} }
return this.matchProducts(rawItems);
} }
private async matchProducts( private async matchProducts(
+14 -4
View File
@@ -29,7 +29,11 @@ export default function ReceiptImportClient() {
const file = e.target.files?.[0]; const file = e.target.files?.[0];
if (!file) return; if (!file) return;
setSelectedFile(file); setSelectedFile(file);
setPreview(URL.createObjectURL(file)); if (file.type === 'application/pdf') {
setPreview('pdf');
} else {
setPreview(URL.createObjectURL(file));
}
setRows([]); setRows([]);
setError(null); setError(null);
setSavedCount(null); setSavedCount(null);
@@ -119,12 +123,18 @@ export default function ReceiptImportClient() {
<input <input
ref={fileRef} ref={fileRef}
type="file" type="file"
accept="image/*" accept="image/*,application/pdf"
capture="environment" capture="environment"
onChange={handleFileChange} onChange={handleFileChange}
style={{ display: 'none' }} style={{ display: 'none' }}
/> />
{preview ? ( {preview === 'pdf' ? (
<div style={{ padding: '1rem', color: '#333' }}>
<div style={{ fontSize: '2.5rem', marginBottom: '0.5rem' }}>📄</div>
<div style={{ fontWeight: 600 }}>{selectedFile?.name}</div>
<div style={{ fontSize: '0.85rem', color: '#888', marginTop: '0.25rem' }}>PDF-kvitto valt</div>
</div>
) : preview ? (
// eslint-disable-next-line @next/next/no-img-element // eslint-disable-next-line @next/next/no-img-element
<img <img
src={preview} src={preview}
@@ -136,7 +146,7 @@ export default function ReceiptImportClient() {
<div style={{ fontSize: '2.5rem', marginBottom: '0.5rem' }}>📷</div> <div style={{ fontSize: '2.5rem', marginBottom: '0.5rem' }}>📷</div>
<div style={{ fontWeight: 600 }}>Fotografera eller välj kvitto</div> <div style={{ fontWeight: 600 }}>Fotografera eller välj kvitto</div>
<div style={{ fontSize: '0.85rem', marginTop: '0.25rem' }}> <div style={{ fontSize: '0.85rem', marginTop: '0.25rem' }}>
Klicka för att välja bild (JPEG, PNG, WebP) Klicka för att välja bild (JPEG, PNG, WebP) eller PDF
</div> </div>
</div> </div>
)} )}