feat: enhance receipt import to support PDF files with updated UI and backend processing
This commit is contained in:
@@ -16,6 +16,7 @@ const ALLOWED_MIMES = [
|
|||||||
'image/webp',
|
'image/webp',
|
||||||
'image/heic',
|
'image/heic',
|
||||||
'image/heif',
|
'image/heif',
|
||||||
|
'application/pdf',
|
||||||
];
|
];
|
||||||
|
|
||||||
@Controller('receipt-import')
|
@Controller('receipt-import')
|
||||||
@@ -37,7 +38,7 @@ export class ReceiptImportController {
|
|||||||
}
|
}
|
||||||
if (!ALLOWED_MIMES.includes(file.mimetype)) {
|
if (!ALLOWED_MIMES.includes(file.mimetype)) {
|
||||||
throw new BadRequestException(
|
throw new BadRequestException(
|
||||||
'Otillåten filtyp. Använd JPEG, PNG eller WebP.',
|
'Otillåten filtyp. Använd JPEG, PNG, WebP eller PDF.',
|
||||||
);
|
);
|
||||||
}
|
}
|
||||||
return this.receiptImportService.parseReceipt(file);
|
return this.receiptImportService.parseReceipt(file);
|
||||||
|
|||||||
@@ -4,11 +4,13 @@ import {
|
|||||||
Logger,
|
Logger,
|
||||||
ServiceUnavailableException,
|
ServiceUnavailableException,
|
||||||
} from '@nestjs/common';
|
} from '@nestjs/common';
|
||||||
|
import * as pdfParse from 'pdf-parse';
|
||||||
import { PrismaService } from '../prisma/prisma.service';
|
import { PrismaService } from '../prisma/prisma.service';
|
||||||
import { ParsedReceiptItem } from './dto/parsed-receipt-item.dto';
|
import { ParsedReceiptItem } from './dto/parsed-receipt-item.dto';
|
||||||
|
|
||||||
const MISTRAL_API_URL = 'https://api.mistral.ai/v1/chat/completions';
|
const MISTRAL_API_URL = 'https://api.mistral.ai/v1/chat/completions';
|
||||||
const PROMPT = `Du är en kvittoläsare. Analysera detta kvitto och returnera ENDAST en JSON-array med alla köpta varor.
|
|
||||||
|
const IMAGE_PROMPT = `Du är en kvittoläsare. Analysera detta kvitto och returnera ENDAST en JSON-array med alla köpta varor.
|
||||||
Varje vara ska ha följande fält:
|
Varje vara ska ha följande fält:
|
||||||
- "rawName": varans namn som det står på kvittot (sträng)
|
- "rawName": varans namn som det står på kvittot (sträng)
|
||||||
- "quantity": antal eller mängd som ett tal (t.ex. 1, 2, 0.5)
|
- "quantity": antal eller mängd som ett tal (t.ex. 1, 2, 0.5)
|
||||||
@@ -17,6 +19,19 @@ Varje vara ska ha följande fält:
|
|||||||
|
|
||||||
Returnera BARA JSON-arrayen utan markdown-formatering.`;
|
Returnera BARA JSON-arrayen utan markdown-formatering.`;
|
||||||
|
|
||||||
|
const TEXT_PROMPT = (text: string) =>
|
||||||
|
`Du är en kvittoläsare. Nedan följer rå text från ett kvitto. Analysera texten och returnera ENDAST en JSON-array med alla köpta varor.
|
||||||
|
Varje vara ska ha följande fält:
|
||||||
|
- "rawName": varans namn som det står på kvittot (sträng)
|
||||||
|
- "quantity": antal eller mängd som ett tal (t.ex. 1, 2, 0.5)
|
||||||
|
- "unit": enhet — välj ett av: "st", "kg", "g", "l", "dl", "cl", "ml", "förp", "pak", "burk", "flaska"
|
||||||
|
- "price": pris i SEK som ett tal, eller null
|
||||||
|
|
||||||
|
Returnera BARA JSON-arrayen utan markdown-formatering.
|
||||||
|
|
||||||
|
Kvittotext:
|
||||||
|
${text}`;
|
||||||
|
|
||||||
@Injectable()
|
@Injectable()
|
||||||
export class ReceiptImportService {
|
export class ReceiptImportService {
|
||||||
private readonly logger = new Logger(ReceiptImportService.name);
|
private readonly logger = new Logger(ReceiptImportService.name);
|
||||||
@@ -31,9 +46,20 @@ export class ReceiptImportService {
|
|||||||
);
|
);
|
||||||
}
|
}
|
||||||
|
|
||||||
const base64 = file.buffer.toString('base64');
|
const isPdf = file.mimetype === 'application/pdf';
|
||||||
const mimeType = file.mimetype || 'image/jpeg';
|
const rawItems = isPdf
|
||||||
|
? await this.parseReceiptFromPdf(file.buffer, apiKey)
|
||||||
|
: await this.parseReceiptFromImage(file.buffer, file.mimetype, apiKey);
|
||||||
|
|
||||||
|
return this.matchProducts(rawItems);
|
||||||
|
}
|
||||||
|
|
||||||
|
private async parseReceiptFromImage(
|
||||||
|
buffer: Buffer,
|
||||||
|
mimeType: string,
|
||||||
|
apiKey: string,
|
||||||
|
): Promise<ParsedReceiptItem[]> {
|
||||||
|
const base64 = buffer.toString('base64');
|
||||||
const response = await fetch(MISTRAL_API_URL, {
|
const response = await fetch(MISTRAL_API_URL, {
|
||||||
method: 'POST',
|
method: 'POST',
|
||||||
headers: {
|
headers: {
|
||||||
@@ -50,7 +76,7 @@ export class ReceiptImportService {
|
|||||||
type: 'image_url',
|
type: 'image_url',
|
||||||
image_url: { url: `data:${mimeType};base64,${base64}` },
|
image_url: { url: `data:${mimeType};base64,${base64}` },
|
||||||
},
|
},
|
||||||
{ type: 'text', text: PROMPT },
|
{ type: 'text', text: IMAGE_PROMPT },
|
||||||
],
|
],
|
||||||
},
|
},
|
||||||
],
|
],
|
||||||
@@ -59,6 +85,50 @@ export class ReceiptImportService {
|
|||||||
}),
|
}),
|
||||||
});
|
});
|
||||||
|
|
||||||
|
return this.extractItemsFromMistralResponse(response, 'bild');
|
||||||
|
}
|
||||||
|
|
||||||
|
private async parseReceiptFromPdf(
|
||||||
|
buffer: Buffer,
|
||||||
|
apiKey: string,
|
||||||
|
): Promise<ParsedReceiptItem[]> {
|
||||||
|
let pdfText: string;
|
||||||
|
try {
|
||||||
|
const parsed = await pdfParse(buffer);
|
||||||
|
pdfText = parsed.text?.trim();
|
||||||
|
} catch {
|
||||||
|
throw new BadRequestException('Kunde inte läsa PDF-filen. Kontrollera att filen inte är skadad.');
|
||||||
|
}
|
||||||
|
|
||||||
|
if (!pdfText || pdfText.length < 20) {
|
||||||
|
throw new BadRequestException(
|
||||||
|
'PDF-filen verkar inte innehålla läsbar text. Prova att fotografera kvittot istället.',
|
||||||
|
);
|
||||||
|
}
|
||||||
|
|
||||||
|
this.logger.log(`PDF-text extraherad (${pdfText.length} tecken)`);
|
||||||
|
|
||||||
|
const response = await fetch(MISTRAL_API_URL, {
|
||||||
|
method: 'POST',
|
||||||
|
headers: {
|
||||||
|
'Content-Type': 'application/json',
|
||||||
|
Authorization: `Bearer ${apiKey}`,
|
||||||
|
},
|
||||||
|
body: JSON.stringify({
|
||||||
|
model: 'mistral-small-latest',
|
||||||
|
messages: [{ role: 'user', content: TEXT_PROMPT(pdfText) }],
|
||||||
|
max_tokens: 2000,
|
||||||
|
temperature: 0.1,
|
||||||
|
}),
|
||||||
|
});
|
||||||
|
|
||||||
|
return this.extractItemsFromMistralResponse(response, 'PDF');
|
||||||
|
}
|
||||||
|
|
||||||
|
private async extractItemsFromMistralResponse(
|
||||||
|
response: Response,
|
||||||
|
source: string,
|
||||||
|
): Promise<ParsedReceiptItem[]> {
|
||||||
if (!response.ok) {
|
if (!response.ok) {
|
||||||
const err = await response.text();
|
const err = await response.text();
|
||||||
this.logger.error(`Mistral API svarade ${response.status}: ${err}`);
|
this.logger.error(`Mistral API svarade ${response.status}: ${err}`);
|
||||||
@@ -70,19 +140,17 @@ export class ReceiptImportService {
|
|||||||
};
|
};
|
||||||
const content = data.choices?.[0]?.message?.content ?? '[]';
|
const content = data.choices?.[0]?.message?.content ?? '[]';
|
||||||
|
|
||||||
let rawItems: ParsedReceiptItem[];
|
|
||||||
try {
|
try {
|
||||||
const clean = content.replace(/```(?:json)?/gi, '').trim();
|
const clean = content.replace(/```(?:json)?/gi, '').trim();
|
||||||
rawItems = JSON.parse(clean);
|
const items = JSON.parse(clean);
|
||||||
if (!Array.isArray(rawItems)) throw new Error('Inte en array');
|
if (!Array.isArray(items)) throw new Error('Inte en array');
|
||||||
|
return items as ParsedReceiptItem[];
|
||||||
} catch {
|
} catch {
|
||||||
this.logger.error('Kunde inte parsa Mistral-svar:', content);
|
this.logger.error(`Kunde inte parsa Mistral-svar (${source}):`, content);
|
||||||
throw new BadRequestException(
|
throw new BadRequestException(
|
||||||
'Kvittot kunde inte tolkas. Försök med en tydligare bild.',
|
`Kvittot kunde inte tolkas. Försök med en tydligare ${source === 'PDF' ? 'PDF' : 'bild'}.`,
|
||||||
);
|
);
|
||||||
}
|
}
|
||||||
|
|
||||||
return this.matchProducts(rawItems);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
private async matchProducts(
|
private async matchProducts(
|
||||||
|
|||||||
@@ -29,7 +29,11 @@ export default function ReceiptImportClient() {
|
|||||||
const file = e.target.files?.[0];
|
const file = e.target.files?.[0];
|
||||||
if (!file) return;
|
if (!file) return;
|
||||||
setSelectedFile(file);
|
setSelectedFile(file);
|
||||||
setPreview(URL.createObjectURL(file));
|
if (file.type === 'application/pdf') {
|
||||||
|
setPreview('pdf');
|
||||||
|
} else {
|
||||||
|
setPreview(URL.createObjectURL(file));
|
||||||
|
}
|
||||||
setRows([]);
|
setRows([]);
|
||||||
setError(null);
|
setError(null);
|
||||||
setSavedCount(null);
|
setSavedCount(null);
|
||||||
@@ -119,12 +123,18 @@ export default function ReceiptImportClient() {
|
|||||||
<input
|
<input
|
||||||
ref={fileRef}
|
ref={fileRef}
|
||||||
type="file"
|
type="file"
|
||||||
accept="image/*"
|
accept="image/*,application/pdf"
|
||||||
capture="environment"
|
capture="environment"
|
||||||
onChange={handleFileChange}
|
onChange={handleFileChange}
|
||||||
style={{ display: 'none' }}
|
style={{ display: 'none' }}
|
||||||
/>
|
/>
|
||||||
{preview ? (
|
{preview === 'pdf' ? (
|
||||||
|
<div style={{ padding: '1rem', color: '#333' }}>
|
||||||
|
<div style={{ fontSize: '2.5rem', marginBottom: '0.5rem' }}>📄</div>
|
||||||
|
<div style={{ fontWeight: 600 }}>{selectedFile?.name}</div>
|
||||||
|
<div style={{ fontSize: '0.85rem', color: '#888', marginTop: '0.25rem' }}>PDF-kvitto valt</div>
|
||||||
|
</div>
|
||||||
|
) : preview ? (
|
||||||
// eslint-disable-next-line @next/next/no-img-element
|
// eslint-disable-next-line @next/next/no-img-element
|
||||||
<img
|
<img
|
||||||
src={preview}
|
src={preview}
|
||||||
@@ -136,7 +146,7 @@ export default function ReceiptImportClient() {
|
|||||||
<div style={{ fontSize: '2.5rem', marginBottom: '0.5rem' }}>📷</div>
|
<div style={{ fontSize: '2.5rem', marginBottom: '0.5rem' }}>📷</div>
|
||||||
<div style={{ fontWeight: 600 }}>Fotografera eller välj kvitto</div>
|
<div style={{ fontWeight: 600 }}>Fotografera eller välj kvitto</div>
|
||||||
<div style={{ fontSize: '0.85rem', marginTop: '0.25rem' }}>
|
<div style={{ fontSize: '0.85rem', marginTop: '0.25rem' }}>
|
||||||
Klicka för att välja bild (JPEG, PNG, WebP)
|
Klicka för att välja bild (JPEG, PNG, WebP) eller PDF
|
||||||
</div>
|
</div>
|
||||||
</div>
|
</div>
|
||||||
)}
|
)}
|
||||||
|
|||||||
Reference in New Issue
Block a user