INTRODUCCIÓN
El objetivo final del modelamiento de un campo petrolero es idear una estrategia óptima para desarrollar, administrar y operar el campo. Para algunos campos petroleros, la optimización de las operaciones de producción puede ser un factor importante para aumentar las tasas de producción y reducir los costos. Mientras que para pozos individuales u otros sistemas pequeños el análisis nodal simple puede ser adecuado, los sistemas grandes y complejos exigen un enfoque mucho más sofisticado para predecir con precisión la respuesta de un sistema de producción y para examinar escenarios operativos alternativos de manera eficiente.
A medida que los algoritmos de optimización y las técnicas de simulación de yacimientos continúan desarrollándose y la capacidad computacional continúa aumentando, las instalaciones de petróleo y gas que antes se pensaba que no eran candidatas para el control u optimización avanzados están siendo objeto de nuevas consideraciones.
El presente estudio compara las predicciones de producción de un pozo tipo de la arenisca T inferior del campo Sacha con las obtenidas mediante software comercial con el fin de mejorar el método de cálculo y tener mayor exactitud del volumen de fluidos a producir para que las facilidades de producción y de levantamiento de los fluidos sean las idóneas. Además, se presenta propuestas en base a los resultados obtenidos, los cuales servirán como fundamentos teóricos y técnicos para futuros proyectos de explotación de pozos.
MATERIALES Y MÉTODOS
El presente estudio se ha aplicado en un enfoque analítico - descriptivo, en el cual se analizó la predicción de la producción de agua, gas y petróleo, a través de la utilización de software comercial en la arena T inferior del campo Sacha basados en los datos de presión de entrada de la bomba electrosumergible y la producción de los pozos del año 2021. En la Tabla 1 se presentan los datos de producción del pozo tipo.
Consideraciones teóricas
Los métodos de optimización de machine learning en la industria petrolera se introdujeron por primera vez en la industria de exploración y producción (E&P) de petróleo en la década de 1940, y desde entonces se han utilizado ampliamente para predecir, estimar y determinar varios parámetros operativos. Estos métodos se clasifican principalmente en tres grupos que incluyen técnicas de programación lineal, entera y no lineal.
Los algoritmos de inteligencia artificial (IA) se han utilizado ampliamente para resolver problemas en la industria del petróleo y el gas. Zhou (2019) menciona que la IA se define como la capacidad de los agentes inteligentes para el aprendizaje continuo en el entorno correspondiente y la percepción de determinadas actividades. AI se compone principalmente de Algoritmos Evolutivos (EA), Inteligencia de Enjambre (SI), Lógica Difusa (FL) y Redes Neuronales Artificiales (RNA).
Red neural artificial (RNA)
Consiste en un conjunto de unidades de procesamiento simples, que comunicarse mediante el envío de señales entre sí a través de un gran número de conexiones ponderadas. La neurona recibe la información de sus vecinos o fuentes externas y usar esta entrada para calcular una señal de salida que luego se propaga a otras unidades. Además de este procesamiento, la segunda tarea es el ajuste de los pesos. El sistema es inherentemente paralelo en el sentido de que muchas unidades pueden realizar sus cálculos al mismo tiempo. En la mayoría de los casos, se supone que cada unidad proporciona una contribución aditiva a la entrada de la unidad con la que está conectado (Rahmanifard & Plaksina, 2018).
Como se muestra en la Figura 1, la entrada total (sk(t)) a la unidad k es una simple suma ponderada de las salidas de cada una de las unidades conectadas más un término de polarización o compensación (θk) por lo que se requiere una regla que calcule el efecto de la entrada total sobre la salida de la unidad.
Por lo tanto, una función (Fk) que toma la entrada total sk(t) y produce un nuevo valor de la se necesita la activación de la unidad k (función de activación o transferencia). Las funciones de transferencia sirven principalmente como un tipo de filtro o puerta que permite que algunas señales se muevan avanzar y detener a otros a medida que avanzan desde los nodos de entrada a los de salida. lo más las funciones de activación comúnmente utilizadas son sigmoide logarítmica, sigmoide tangente hiperbólica, y funciones lineales.
Hay varios patrones de RNA, como redes feed-forward, redes recurrentes, etc. Las redes feed-forward convencionales son las redes más comunes para la aproximación de funciones mismas que constan de grupos de nodos interconectados dispuestos en capas correspondientes a entrada, oculta y nodos de salida, se muestra en la Figura 2.
Lenguaje Python
El lenguaje de programación Python es un lenguaje fácil de aprender. Éste cuenta con estructuras de alto nivel que puede dar un enfoque simple pero asertivo hacia la programación dirigida a objetos. Las características que se revelan en su sintaxis y su tipado dinámico lo transforman en un lenguaje ideal para scripting y para el uso de aplicaciones en diferentes áreas (inteligencia artificial, big data, data science, desarrollo web, entre otros) (Ibrahim & Bilchick, 2021). En la Figura 3 se presenta el algoritmo utilizado en el lenguaje de programación Python para las simulaciones.
Análisis y depuración de datos
Para la simulación fue utilizada la normalización de datos para el posterior uso de clustering con el objetivo de eliminar los valores atípicos. Se realizó un cálculo iterativo de radio vs producción con el fin de obtener el mejor ajuste. Para el caso de estudio se determinó si los datos tienen un rango mayor al radio de 0.2 para fluidos y 0.8 para gas es un valor atípico. La Figura 4 muestra la ventana de análisis y depuración de datos donde se grafican la PIP vs producción de fluido (izquierdo) y la PIP vs producción de gas (derecho).
Modelo entrenado
Luego de la depuración de datos se realizó el entrenamiento de la RNA, en la que se obtuvo gráficas comparativas de la producción real y estimada con la red neuronal de los pozos como se observa en la Figura 5. La primera estimación se utilizó como variable la PIP, mientras que en la segunda estimación a más de la PIP se utilizó la salinidad del agua de formación. En la sobreposición de las curvas se observa el mejor ajuste del algoritmo que permitirá la predicción de la producción.
RESULTADOS Y DISCUSIÓN
Para determinar la producción con el software comercial se utilizó la información disponible del pozo tipo. De forma paralela se realizaron dos predicciones de producción de fluido y gas: la primera con el valor de la PIP del pozo tipo de 250 Psi, y la segunda con el mismo valor de la PIP de la primera simulación y el valor de la salinidad del agua de formación de 50000 ppm. A partir de estos resultados se realizó la comparación de producción real versus la simulada tanto en el software comercial como en Python del pozo tipo como se indica en la Tabla 2.
Análisis comparativo de las simulaciones
En la primera simulación se obtuvo un error del 10% con respecto al valor real de producción de fluidos del pozo tipo ya que únicamente se utilizó una variable. En la segunda simulación, el error se redujo a 0,5% debido a que se incrementó una variable adicional para obtener un mejor ajuste. Previamente se había realizado simulaciones con variables como la temperatura del pozo y el grado API donde no se determinó un cambio significativo de resultados por ser valores promedios para todos los pozos del Campo. Por el contrario, la PIP de la BES se relaciona directamente con la producción y la salinidad con la porosidad, permeabilidad, saturación de agua, arena productora y presión capilar, que son propiedades directamente relacionadas en el potencial de producción. En la Figura 6 se muestran los gráficos de barras de las simulaciones.
CONCLUSIONES
El uso de nuevas tecnologías como el machine learning permite que las predicciones de producción sean más precisas y se reduzca la incertidumbre.
La concatenación y normalización de datos permiten eliminar los valores atípicos por lo cual es importante tener criterios adecuados para excluir estos valores como conocer el mejor método para este caso fue el clustering y dentro de este la variable radio con el mejor ajuste de 0.8 para gas y 0.2 para fluidos.
La reutilización de código en las funciones optimiza espacio, y contribuye con la eficiencia del programa, esto puesto que tanto para gas como para fluidos se utiliza el mismo código además de que las funciones que requieran cálculos similares se utiliza la misma función en la que ya se realizó ese cálculo previo.
Las variables que actúan directamente en el potencial de producción del pozo tipo reducen el porcentaje de error en la predicción de producción con respecto al software comercial.
El mejoramiento de la predicción de producción se debe al uso de las redes neuronales artificiales que son las responsables de crear algoritmos de inteligencia artificial, estos permiten emular el comportamiento no lineal presentado por la PIP y la salinidad con respecto a la producción de fluido.