Spaces:

jeysshon
/

Insight_DKG

Build error

App Files Files Community

jeysshon commited on Mar 3, 2025

Commit

498ce53

verified ·

1 Parent(s): 63dc01f

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -7

app.py CHANGED Viewed

@@ -13,10 +13,10 @@ import random
 import uuid
 from streamlit_pdf_viewer import pdf_viewer  # Visor de PDF integrado en Streamlit
-# Inicializa el cliente de ChromaDB
 client = initialize_client()
-# Frases sarcásticas para el proceso de PDF
 sarcastic_lines = [
     "Cocinando el PDF... 🍳",
     "Esto puede tomar un momento; estoy convenciendo al PDF de que coopere... 🤔",
@@ -49,6 +49,7 @@ st.markdown("Sube tu PDF en formato de texto y haz preguntas sobre su contenido.
 uploaded_file = st.file_uploader("Subir PDF", type="pdf")
 if uploaded_file:
     document_id = generate_document_id()
     st.success("¡Archivo subido con éxito! Podemos comenzar.")
@@ -61,19 +62,19 @@ if uploaded_file:
     st.subheader("PDF Subido")
     pdf_viewer(pdf_bytes)
-    # Paso 2: Procesar PDF
     with st.spinner("Procesando..."):
         st.markdown(random.choice(sarcastic_lines))
         pages_and_text = read_pdf(pdf_bytes)
     st.success("¡PDF procesado con éxito!")
-    # Paso 3: Dividir texto en chunks
     with st.spinner("Dividiendo en secciones..."):
         st.markdown(random.choice(sarcastic_lines))
         processed_chunks = process_chunks(pages_and_text)
     st.success("¡Texto dividido en chunks!")
-    # Paso 4: Generar embeddings
     with st.spinner("Creando embeddings..."):
         st.markdown(random.choice(sarcastic_lines))
         embeddings_df = embed_text_chunks(processed_chunks)
@@ -86,13 +87,14 @@ if uploaded_file:
     st.success(f"¡Embeddings guardados para el documento con ID: {document_id}")
     # Paso 6: Interacción con el chat
     query = st.chat_input("Pregunta algo sobre el documento")
     if query:
         with st.spinner("Buscando respuestas..."):
-            context = query_chroma_db(user_id, document_id, query)
             response = query_llm(query, user_id, document_id)
             # Agrega la interacción al historial
             st.session_state.qa_history.append({"question": query, "answer": response})

 import uuid
 from streamlit_pdf_viewer import pdf_viewer  # Visor de PDF integrado en Streamlit
+# Inicializa el cliente de ChromaDB (base de datos vectorial)
 client = initialize_client()
+# Frases sarcásticas para mostrar al usuario mientras procesa
 sarcastic_lines = [
     "Cocinando el PDF... 🍳",
     "Esto puede tomar un momento; estoy convenciendo al PDF de que coopere... 🤔",
 uploaded_file = st.file_uploader("Subir PDF", type="pdf")
 if uploaded_file:
+    # Genera un ID único de documento
     document_id = generate_document_id()
     st.success("¡Archivo subido con éxito! Podemos comenzar.")
     st.subheader("PDF Subido")
     pdf_viewer(pdf_bytes)
+    # Paso 2: Procesar PDF (extraer texto)
     with st.spinner("Procesando..."):
         st.markdown(random.choice(sarcastic_lines))
         pages_and_text = read_pdf(pdf_bytes)
     st.success("¡PDF procesado con éxito!")
+    # Paso 3: Dividir texto en oraciones y chunks
     with st.spinner("Dividiendo en secciones..."):
         st.markdown(random.choice(sarcastic_lines))
         processed_chunks = process_chunks(pages_and_text)
     st.success("¡Texto dividido en chunks!")
+    # Paso 4: Generar embeddings localmente
     with st.spinner("Creando embeddings..."):
         st.markdown(random.choice(sarcastic_lines))
         embeddings_df = embed_text_chunks(processed_chunks)
     st.success(f"¡Embeddings guardados para el documento con ID: {document_id}")
     # Paso 6: Interacción con el chat
+    # Campo de texto para que el usuario haga su pregunta
     query = st.chat_input("Pregunta algo sobre el documento")
     if query:
         with st.spinner("Buscando respuestas..."):
+            # Opcional: si quieres ver cuál es el contexto extraído, puedes llamar a:
+            # context = query_chroma_db(user_id, document_id, query)
             response = query_llm(query, user_id, document_id)
             # Agrega la interacción al historial
             st.session_state.qa_history.append({"question": query, "answer": response})