Parlem? Veure servei Anar
Documento de Trabajo

La tecnologia quantitativa dels roboadvisors

Gerard Albà Soler, Arnau Vía Martínez-Seara | 24 de març de 2023
Fintech
La tecnologia quantitativa dels roboadvisors
  1. Introducción
  2. La disrupción fintech del modelo tradicional
    1. Evolución del negocio: datos y volúmenes
    2. Democratización del Asesoramiento y la Banca Privada
  3. Cómo funciona un Roboadvisor
    1. Proceso de contratación u onboarding
    2. Conocimiento del inversor: perfil de riesgo y definición de objetivos
      1. Perfil de riesgo
      2. Sesgos y preferencias del inversor
      3. Objetivos de la cartera de inversión
      4. Venta cruzada de otros productos financieros
    3. Selección del universo invertible
    4. Selección de los instrumentos que representan cada clase de activo
      1. Indexación directa
    5. Optimización de la cartera
    6. Monitorización y rebalanceo
    7. Optimización de impuestos
      1. Estructura de cuentas
      2. Algoritmos Tax harvesting
      3. Forzar pérdidas
    8. Reporting
  4. Los algoritmos de gestión de carteras
  5. La teoría moderna de carteras
  6. Conclusiones
    1. Observaciones
    2. Modificaciones
  7. Black Litterman
    1. Observaciones
  8. APT (Arbitrage Pricing Theory12) y modelos factoriales
  9. Full-scale optimization
    1. Observaciones
  10. HRP
    1. Detalles del algoritmo
      1. Construcción de clusters
    2. Observaciones
  11. Casos de estudio
  12. Betterment
    1. Construcción de cartera
      1. Universo de activos
      2. Estimación de los retornos de mercado
      3. Black Litterman y Fama-French
      4. Monte Carlo
      5. Impuestos
  13. Wealthfront
    1. Construcción de cartera
    2. Universo de activos
    3. Estimación de los retornos de mercadoBlack Litterman y APT
    4. Black Litterman y APT
    5. Frontera eficiente
  14. Charles Schwab
    1. Momentos de orden superior y cópulas
    2. Función de utilidad y CVar
  15. Vanguard
    1. Planificación financiera multiobjetivo
  16. DQN
    1. Q-Table
    2. Q-Values
  17. Five
  18. Conclusiones
  19. Referencias

Introducción

El objetivo principal de este estudio es presentar la tecnología cuantitativa en la que se basa la innovación fintech de los roboadvisors o gestores automatizados de inversión. El uso de modelos financieros y algoritmos cuantitativos, y su propia evolución, es uno de los factores principales que ha permitido la digitalización de esta actividad y un cambio disruptivo en el modelo de negocio tradicional, exclusivo, hasta hace poco, de la banca privada o de la industria de gestión de activos.

Veremos las diferentes metodologías -de la teoría a la implementación práctica con casos reales- utilizadas por los roboadvisors líderes del mercado, desde las adaptaciones de modelos financieros académicos de media y varianza como Markowitz (premio Nobel en 1990) o Black-Litterman (desarrollado por el banco de inversión Goldman Sachs en los años 90 a partir del modelo CAPM de Sharpe -premio Nobel en 1990-), los modelos de factores (como Fama-French; E. Fama recibió también el premio Nobel en 2013), técnicas estadísticas como la simulación de escenarios, o más recientemente la aplicación del machine learning y otras técnicas propias del ámbito de data science.

Nota: durante el artículo utilizaremos indistintamente roboadvisor o RA.

 

La disrupción fintech del modelo tradicional

Los roboadvisors son empresas digitales emergentes (parte de las llamadas fintech) del sector del asesoramiento y gestión de inversiones. Ofrecen a los clientes la gestión de carteras de inversión globales, online y de forma automatizada, a menudo personalizada según el perfil del cliente inversor. Aparecieron en torno a 2008, tras la crisis financiera, y han mantenido un crecimiento continuado del patrimonio gestionado, innovando y compitiendo con los actores tradicionales de la banca personal y banca privada. Betterment, por ejemplo, uno de los roboadvisors pioneros y ahora líder, nacida en 2010 en EE.UU, gestiona actualmente más de 33.000 millones de activos de más de 730 mil clientes.

La propuesta de valor diferencial de los roboadvisors los convierten en una buena manera alternativa de invertir, siendo la tecnología cuantitativa para invertir de forma diversificada y eficiente una de sus características diferenciales. Además, destaca entre las causas de su popularización, el hecho de que su acceso es muy asequible, con importes mínimos de inversión muy bajos. Pero el éxito como modelo de negocio también se explica por los cambios sociales y generacionales que acompañan a la transformación digital de muchos sectores económicos. Las generaciones más jóvenes son más receptivas a las tecnologías digitales, están bien formadas, y a menudo valoran el empoderamiento sobre sus inversiones que les ofrecen los roboadvisors y el acceso online a estas fuentes de información financiera diversa e independiente,

perdiendo peso el servicio que puede ofrecer un asesor individual en un modelo de banca más tradicional. Y ésta es una tendencia que se va extendiendo a todas las generaciones, cada vez más abiertas al uso de las nuevas tecnologías también.

 

Evolución del negocio: datos y volúmenes

El éxito de los roboadvisors se muestra en el creciente volumen de activos gestionados. La siguiente gráfica muestra este crecimiento de activos bajo gestión durante los últimos años, así como el crecimiento esperado hasta los usd 3 billones proyectados para 2025. A pesar del fuerte crecimiento, este volumen es aún un porcentaje pequeño del total gestionado globalmente por la industria de gestión de activos: superior a los usd 100 billones (BCG1, 2021).

 

Figura 1. Robo-advisors: Assets under management in million USD (world-wide)

Fuente: Statista 2022. “Robo-advisors: Activos bajo gestión en millones de USD en todo el mundo”

 

La siguiente tabla muestra los mayores roboadvisors por volumen de negocio, con casos de transformación de modelos tradicionales (como Vanguard, originalmente una gestora de fondos indexados, o Charles Schwab, inicialmente un broker de servicios de compra-venta de valores), y otros nuevos negocios fintech como Betterment y Wealthfront, que empezaron como startups emergentes). Los datos de actividad de estos y otros roboadvisors se pueden encontrar en la web: The Robo Report (The Robo Report2, 2022)

 

Tabla 1. Largest Robo-Advisors by AUM

Fuente: The Robo Report2, 2022. “Los 5 robo-advisor más grandes del mundo en activos bajo gestión

El mercado europeo es mucho menor en comparación (ECON3, 2021), con unos usd 108.000 millones de activos bajo gestión. Los principales mercados nacionales son Reino Unido (18.000 millones), Italia (15.000 millones), Francia (13.000 millones) y Alemania (9.000 millones). En España (Roboadvisors.es4, 2022), destaca sobre todo: Indexa Capital (1.400 millones). Los clientes invierten importes pequeños, con un promedio de usd 4.500 globalmente. El número de clientes en Europa era de 20,1 millones en 2020, con 40 millones esperados en 2025.

 

Figura 2. Robo-advisors: Users in Europe (incl.non-EU, in thousand users)

Fuente: Statista 2022. “Robo-advisors: Usuarios en Europa (incluyendo países no pertenecientes a la Unión Europea) en miles de usuarios”

 

Democratización del Asesoramiento y la Banca Privada

Los roboadvisors son un buen ejemplo de la verdadera disrupción que está provocando la aplicación de la tecnología (datos, algoritmos y digitalización) en los servicios financieros tradicionales. El aspecto probablemente más destacado de este cambio introducido por el nuevo modelo de los roboadvisors es la democratización, el acceso a la gestión de calidad de los ahorros y las inversiones del público general. Es un cambio estructural en finanzas personales, que ha permitido que no sólo los grandes patrimonios o los más expertos tengan una buena gestión y acceso a los mercados financieros. Los ahorradores y pequeños inversores -con menos conocimiento experto y excluidos tradicionalmente por su patrimonio más reducido- han quedado históricamente fuera del servicio prestado por los asesores financieros tradicionales o la banca privada exclusiva, limitados a productos de ahorro de las entidades bancarias sobretodo.

Los nuevos modelos digitales, en cambio, han aportado un acceso inmediato -y desde cualquier sitio, no sólo en ciudades o grandes centros financieros-, así como un coste reducido, a un servicio de inversiones de muy buena calidad, a inversores de cualquier perfil. Esto facilita el ahorro a largo plazo, las pensiones, o cualquier otro objetivo financiero.

Asimismo, esto supone un cambio en el modelo de negocio de las entidades que ya prestan servicios de inversiones. Los roboadvisors son una oportunidad de crecer en estas actividades en un mercado mayor, y con un modelo de procesos y organizativo eficiente y escalable. A modo de ejemplo, en el mercado español (Informa5, 2021), el patrimonio de clientes de banca privada y personal era de eur 1,15 billones, correspondiente a 7,7 millones de clientes. De éstos, un 54% del patrimonio era de clientes de banca personal (con menos de 120.000 euros de ahorro), que representaba a la vez un 94% de los clientes de estos segmentos. La aparición de los roboadvisors ha permitido un cambio estratégico en la industria, pudiendo ofrecer a todos estos clientes, un servicio digitalizado de inversiones, que había estado al alcance únicamente de los clientes de banca privada con más recursos , de forma presencial y de la mano de especialistas dedicados.

Cómo funciona un Roboadvisor

Aunque el objetivo de este artículo es la descripción de los modelos financieros y algoritmos cuantitativos usados como motor de los RA, a continuación haremos una descripción resumida de cómo funciona en general un RA para dar el contexto necesario al uso de dichos algoritmos. Daremos referencias de algunos de los casos reales que posteriormente estudiaremos con más detalle como Betterment, Wealthfront, Charles Schwab, Vanguard o Indexa.

 

Proceso de contratación u onboarding

La primera ventaja de un RA respecto a un banco tradicional es la digitalización y automatización del proceso de onboarding. Esta facilidad de contratación del servicio explica una parte importante del éxito de estos servicios, y además es habitual que durante el proceso, se muestre una cartera modelo de inversión (que a menudo no es en la que el cliente acabará invirtiendo) y proyecciones de retorno para motivar al cliente a seguir adelante.

 

Conocimiento del inversor: perfil de riesgo y definición de objetivos

Perfil de riesgo

Un RA corresponde a un servicio discrecional de carteras, y como tal, la regulación financiera sobre protección del inversor requiere una evaluación de la tolerancia al riesgo, conocimientos financieros y objetivos del cliente, incluyendo horizonte temporal y necesidades de liquidez. Una explicación más detallada de los principales aspectos regulatorios de los roboadvisors en Europa se puede encontrar en el estudio específico del Parlamento Europeo (ECON committee6, 2021). Además, en mercados regulados como España, deberán estar dados de alta como empresas de servicios de inversión. El régimen jurídico asociado contempla las figuras de sociedades y agencias de valores (que permiten operar en mercado), las gestoras de carteras (limitadas a la gestión de carteras exclusivamente), y las empresas de asesoramiento financiero (EAFI)7.

Sin olvidar que los RA son servicios industrializados y enfocados a las masas, la mayoría intenta perfilar la solución más allá del apetito al riesgo intentando lograr una visión más transversal del cliente que transmita una cierta personalización. Este es el primer ejemplo donde el uso de algoritmos es fundamental. Algunos ejemplos a continuación:

 

Sesgos y preferencias del inversor

Betterment hace gala de tener 101 diferentes carteras para dar una solución para cada tipo de inversor. Aunque si solo importara el riesgo y el retorno no sería necesario tener tantas carteras distintas, pretenden dar respuesta a sesgos más subjetivos de sus clientes; ofrecen carteras con temáticas medioambientales, de innovación tecnológica, de factores o enfocadas a generar ingresos en forma de cupones o dividendos. El primer desafío en este tipo de carteras es integrar las preferencias del cliente a una construcción sólida de la cartera.

 

Objetivos de la cartera de inversión

Además de definir la tolerancia al riesgo y los sesgos del inversor, la mayoría se esfuerza en clarificar el objetivo del ahorro en categorías como: comprar una casa, jubilación, universidad de los hijos, etc. Este punto es útil para ayudar al cliente a definir objetivos realistas e informarle de si son coherentes con su tolerancia al riesgo, horizonte personal y necesidades de liquidez. Wealthfront, por ejemplo, ofrece un cuestionario donde ayuda al inversor a calcular cuánto dinero necesita para la educación de sus hijos, u otro donde le ayuda a calcular si sus objetivos actuales son compatibles con pasar un año viajando por el mundo. El objetivo de inversión también es relevante para entender qué estructura legal es más beneficiosa para el cliente, en Estados Unidos la mayoría de RA ofrece soluciones para cuentas con bonificaciones de impuestos como cuentas para la jubilación o para el ahorro para los estudios de los hijos. En España Indexa Capital ofrece soluciones en forma de cartera de fondos traspasables, que difieren el pago de impuestos durante los rebalanceos, o planes de pensiones. También destaca en España el roboadvisor Inbestme8 por su característica de ofrecer una optimización fiscal en la gestión de las pérdidas y ganancias de los ETFs que utiliza en sus carteras de inversión.

 

Venta cruzada de otros productos financieros

Otra razón para intentar conocer mejor a los clientes es la posibilidad de ofrecer productos que sean relevantes para ellos según su situación personal. Ofrecer propuestas para el ahorro para los estudios de los hijos a una pareja con niños pequeños, o un plan de jubilación a alguien que tiene unos ingresos elevados pero que no ha realizado una planificación de su jubilación son ejemplos de ello.

 

Selección del universo invertible

La mayoría de RA desarrolla en su página web la razón de su selección de universo invertible. En general, la mayoría incluye renta variable y renta fija global, y algún elemento diversificador y protector de la inflación tales como bonos de inflación, inversión inmobiliaria o commodities. Cabe destacar que aunque todos hacen gala de fomentar la diversificación, la mayoría deja fuera partes de los mercados financieros por distintas razones.

Así, por ejemplo, los RA europeos tienden a excluir la renta fija no euro, sobreponderando, consecuentemente, la renta fija euro que es menos del 30% del mercado global de renta fija. Otro grupo de activos que típicamente queda excluido son los mercados privados, private equity, venture capital, private debt, etc, lógicamente la razón es la dificultad operativa que supone, las complicaciones derivadas de si los clientes entienden los activos y sobre todo el alto coste de estas estrategias.

Por último, también es destacable las diferencias entre varios RA. Betterment, por ejemplo, excluye los REIT (o fondos inmobiliarios) como clase de activo porque considera que la exposición general a equity ya da una exposición proporcional al tamaño del sector inmobiliario, pero otros como Wealthfront o Charles Schwab sí que creen que aporta valor y diversificación.

 

Selección de los instrumentos que representan cada clase de activo

Una vez definido el universo invertible, el siguiente paso es elegir aquellos instrumentos que mejor representan cada clase de activo. Es poco habitual que los RA ofrezcan inversión directa o que hagan selección de títulos individuales – con alguna excepción que comentaremos en seguida – por ello la práctica totalidad de los procesos de selección de instrumentos se basa en la selección de fondos índices y/o ETFs.

Consecuentemente dichos procesos se apoyan en un análisis cuantitativo que, convenientemente, se puede automatizar. Los parámetros para optimizar la selección son comunes en todos los roboadvisors:

  • Tracking error: es la desviación estándar de las diferencias de retorno entre el fondo/etf y el activo que representa, lógicamente cuanto más bajo mejor pues indica lo bien que el fondo replica el comportamiento del activo en el que se quiere invertir.
  • Comisiones: es uno de los reclamos de los RA, no solo cobran menos comisiones por el servicio si no que los productos que utilizan y las comisiones de transacción son muy bajas. La comisión media de los productos que utilizan los RA se mueve entre 0,08%-0,20% en comparación con la media de los fondos de inversión del mercado que se mueve entre 1%-1,5% en la mayoría de casos.
  • Liquidez: evidentemente también buscan aquellos productos que tienen una liquidez suficiente para absorber las grandes transacciones que estos RA deben ejecutar.

 

Figura 3. Costes y retornos de los fondos de inversión en Europa

Fuente: 5 días. Datos: ESMA “Costes y retornos de los fondos de inversión en Europa”

 

Indexación directa

Es una metodología que permite replicar un índice sin comprar una etf si no comprando todas las acciones (o un subconjunto optimizado minimizando el tracking error). Lógicamente requiere un mínimo que no baja de los 100.000€ para poder implementarse y actualmente solo la ofrecen Schwab y Wealthfront. Está ganando popularidad en Estados Unidos por dos razones principalmente:

  • Optimización de impuestos: debido a que se tiene acciones individuales, se pueden realizar ganancias o pérdidas en algunas acciones comprando otras con un comportamiento similar.
  • Personalización: esta metodología permite seguir un índice aplicando cierta personalización, por ejemplo se puede evitar invertir en una industria o aplicar un sesgo ESG pero manteniendo una correlación elevada con el índice.

 

Optimización de la cartera

Este punto lo trataremos en la sección “Los algoritmos de gestión de carteras”.

 

Monitorización y rebalanceo

La mayoría de RA intentan también optimizar los rebalanceos. La metodología habitual es la que combina los siguientes puntos:
• Aprovechar flujos de caja como dividendos, cupones, depósitos o reembolsos para ajustar la cartera.
• Marcar un máximo de deriva respecto la cartera modelo a partir del cual se ajusta la cartera ejecutando compras y ventas. Este umbral se puede calcular como una desviación máxima por elemento o como una desviación en conjunto y el número concreto varía bastante de un proveedor a otro pero siempre intentan minimizar estos movimientos para no incurrir en costes innecesarios.

 

Optimización de impuestos

Estructura de cuentas

Otro de los principales reclamos de los RA. Como se ha introducido en el apartado de conocimiento del inversor, a menudo esto es tan simple como seleccionar la estructura legal más óptima para el objetivo que se persigue. Ejemplos: plan de pensiones para una cuenta pensada para la jubilación, fondos traspasables para una cartera general (en españa), 401K o IRA en Estados Unidos para la jubilación, cuentas con bonificaciones fiscales para el ahorro para los estudios, etc.

 

Algoritmos Tax harvesting

Otra casuística mucho más interesante es la de vender activos con pérdidas cuando hay ganancias a compensar en una cuenta que tributa por las ganancias. Para que una pérdida pueda compensarse no se puede comprar un activo sustancialmente parecido en un periodo concreto de tiempo (varía según la legislación de cada país). El problema es que la venta del activo que está en pérdidas puede desequilibrar la cartera, de modo que lo que se hace es comprar otro activo con una correlación con el primero suficientemente alta como para mantener una exposición muy parecida. Este proceso es más sencillo cuando se usan fondos índice o etfs, dado que se pueden intercambiar etfs o fondos índices de distintos proveedores que siguen índices parecidos. Un ejemplo destacado es el roboadvisor español Inbestme. Algunas casas incluso se atreven a comprar otro etf que siga el mismo índice, pero esta opción puede atentar contra el espíritu de la norma.

 

Forzar pérdidas

Otra funcionalidad que también tiene algunos RA como Indexa, es la posibilidad de solicitar que en un reembolso o rebalanceo se genere una pérdida o ganancia para compensar con otras inversiones realizadas incluso fuera del ámbito del RA.

 

Reporting

Evidentemente los RA ofrecen un reporting totalmente automatizado y en general muy sencillo para que sea de fácil comprensión y no desencadene en mail de dudas y necesidades de atención al cliente. Algunos intentan utilizar lenguaje y una presentación de la información que transmita un trato personalizado centrándose en el progreso hasta lograr un objetivo y a veces ofreciendo formación sobre temas que pueden interesar al cliente.

 

Los algoritmos de gestión de carteras

Los algoritmos son el motor, la pieza fundamental que permite a un roboadvisor ofrecer el servicio de gestión de carteras automatizada a un número de clientes elevado con la mínima intervención humana. Los RA más avanzados utilizan además algoritmos para la clasificación de clientes o el asesoramiento en materia de planificación patrimonial.

A continuación explicaremos las distintas teorías (modelos financieros, técnicas estadísticas y cuantitativas) que forman los cimientos de la automatización de los RA. Habitualmente los proveedores de RA utilizan una combinación de las técnicas que mostramos a continuación con alguna modificación interna que les permite afirmar que la metodología es propia. El orden utilizado a continuación en la presentación de estas técnicas corresponde aproximadamente a su evolución en el tiempo, desde el punto de vista académico y de su avance en las aplicaciones en construcción de carteras de inversión. En los casos de estudio destacados en la sección siguiente, veremos como se combinan todas de estas técnicas en la práctica, según el modelo financiero y algoritmo de implementación de cada roboadvisor tratado.

 

La teoría moderna de carteras

La teoría moderna de carteras (MPT por sus siglas en inglés), dio el pistoletazo de salida a la inversión cuantitativa. Esta teoría, desarrollada por Harry Markowitz en 1952, cambió la forma de pensar, se pasó de la idea de comprar acciones al mejor precio a la idea de comprar acciones basándose en el riesgo. A continuación se explica la frontera eficiente de Markowitz.

 

Conclusiones

El principio de la cartera eficiente de Markowitz9 es el siguiente; dado un conjunto de activos financieros, encontrar la combinación de los mismos que proporciona máxima rentabilidad para un nivel determinado de riesgo o mínimo riesgo para un nivel determinado de rentabilidad.

En el contexto de Markowitz se toma la varianza como el riesgo de la cartera, y en el contexto de un RA, típicamente se busca la cartera de máxima rentabilidad dado un nivel de riesgo fijado por el perfil del cliente. Los algoritmos que optimizan el par rentabilidad media – varianza se conocen como MVO (mean-variance optimization).

Formulación del problema:

  1. Maximizar:
  2. Con las restricciones:

 

  • Wi son los pesos de cada activo, σi la varianza, μi el retorno esperado y ρi la correlación

  • La restricción significa que la posición en cada uno de los activos es larga.

  • La restricción implica que estamos totalmente invertidos

  • σ* es la condición que se fija

 

Observaciones

  • Es uno de los métodos más utilizados por ser muy intuitivo y relativamente asequible de resolver computacionalmente.
  • Tiene mucha sensibilidad a los inputs y poca estabilidad, defectos que son muy poco deseables en un algoritmo usado para gestionar carteras autónomamente porque podría dar lugar a transacciones innecesarias con los costes asociados.
  • El algoritmo requiere la rentabilidad esperada de cada uno de los activos así como la matriz de varianzas covarianzas pero no da un método para calcularlas. Ambos parámetros son muy poco estables cuando se calculan a partir de datos históricos.
  • Genera carteras concentradas en pocos activos y a menudo el driver principal que guía el proceso de optimización son valores extremos en la matriz de varianzas-covarianzas fruto de error de estimación de la misma.

 

Modificaciones

Debido a los defectos mencionados la mayoría de RA realizan modificaciones al algoritmo. Algunas de las más comunes son:

  • Shrinkage: Es un método para calcular un estimador de la matriz Σ, como un término medio entre un estimador no sesgado pero con mucho error (la matriz histórica de var-cov de la muestra) y un estimador estructurado que reduce los errores extremos – se explicará con más detalle en el apartado “casos reales”.
  • Utilizar CAPM10 para calcular el retorno esperado para los activos. Esta metodología se introdujo con el desarrollo de Black-Litterman como veremos a continuación pero también se puede usar con la frontera eficiente.

 

Black Litterman

El método de BL11, utiliza el mismo principio de optimizar el binomio rentabilidad-riesgo, pero aporta algunas mejoras interesantes. Por un lado propone un método para la estimación de rentabilidades esperadas consistente con la teoría de eficiencia de mercado (EMH efficient market hypothesis) que evita al gestor la necesidad de estimar la rentabilidad esperada para los activos deduciéndolas utilizando CAPM. Por otro, ofrece una metodología para implementar las visiones de gestor de una forma metódica y proporcional a la confianza que se tiene en cada una de estas visiones. El algoritmo crea un vector de rentabilidades esperadas que combina las rentabilidades en equilibrio con las rentabilidades esperadas por las visiones del gestor.

Función de utilidad a maximizar:

Notar que el primer sumando es la rentabilidad de la cartera y el segundo el riesgo (la volatilidad)

Asumiendo la hipótesis de que el mercado es eficiente se puede ver que la rentabilidad esperada por el mercado debe cumplir la siguiente ecuación:

Lo que esta ecuación impone es que la rentabilidad esperada de una cartera es proporcional a su riesgo pues asume que el mercado es eficiente (CAPM10). El vector de rentabilidades esperadas (en equilibrio) es calculable pues Weq son los pesos de la cartera global de mercado (cartera market-cap observable) y podemos estimar la matriz de covarianzas Σ

 

Observaciones

  • BL ofrece un marco metodológico para implementar visiones sobre activos de forma cuantitativa, facilitando así la automatización de carteras con visiones.
  • La “magia” del algoritmo es que el vector de rentabilidades resultante, consigue que los únicos activos que sufran cambios al implementar las visiones del gestor, son aquellos sobre los que el gestor tiene opinión, pero no altera los pesos del resto de activos respecto los pesos en equilibrio dados por el mercado.
  • Resuelve el problema de encontrar un vector de rentabilidades consistente con EMH (hipótesis de eficiencia de mercado).
  • Se puede utilizar también con factores en lugar de activos concretos si se quiere construir una cartera diversificada con visiones que afectan a factores como el value, growth, etc.

 

APT (Arbitrage Pricing Theory12) y modelos factoriales

Los modelos APT descomponen el comportamiento de los activos financieros en una serie de factores económicos o financieros como datos macroeconómicos o rentabilidad de índices financieros. A menudo se utiliza en conjunción con Black-Litterman o Markowitz para definir el vector de rentabilidades esperadas aunque también se puede utilizar de forma aislada.

Formulación:


L es el número de factores
Fj es la rentabilidad de los factores
ε es el riesgo idiosincrático,
activo sin riesgo

Otro uso habitual de este modelo es para explicar el retorno de una cartera descomponiéndose en diferentes factores económicos para que el cliente pueda entender mejor la estructura y los riesgos de su cartera.

El famoso modelo de tres factores de Fama & French13 es un ejemplo de modelo financiero de factores, aunque ajusta o modifica los modelos basados en la hipótesis de mercado eficiente como CAPM y su alternativa con varios factores APT. Dicho modelo explica el retorno de una cartera diversificada descomponiéndola en su exposición al factor mercado, tamaño y valoración, y en un papel posterior lo actualizaron a 5 modelos incluyendo rentabilidad e inversión de la compañía.

 

Full-scale optimization

Esta metodología aplicada en casos de construcción de carteras27 se basa en algoritmos de búsqueda de soluciones que permiten optimizar funciones de utilidad complejas que pueden incorporar preferencias de los clientes como la aversión al riesgo – a diferencia de Markowitz que asume que los inversores son sensibles por igual a subidas y bajadas. Sus ventajas respecto algoritmos MVO son:

  • Se utiliza toda la serie temporal de los activos (recordamos que desde el punto de vista de Markowitz y BL el comportamiento de un activo queda definido con su media y las covarianzas). Esto puede resultar en el uso de cópulas en lugar de correlaciones fijas en el tiempo que modelizan como las correlaciones entre los elementos van variando.
  • Funciones de riesgo más complejas como Conditional Value at Risk.
  • Optimizan funciones de utilidad que pueden representar mejor las preferencias del inversor como por ejemplo una asimetría entre la preferencia de ganancias y pérdidas de la misma magnitud.

A continuación algunos ejemplos:

Fuente: Anderson, R.G.; Binner, J.M.; Elger, T.; Hagstromer, B.; Nilsson, B.; 2008; Mean-Variance vs. Full-Scale Optimization: Broad Evidence for the UK, Federal Reserve Bank of St.Louis Working Paper 2007-016.

Fuente: Anderson, R.G.; Binner, J.M.; Elger, T.; Hagstromer, B.; Nilsson, B.; 2008; Mean-Variance vs. Full-Scale Optimization: Broad Evidence for the UK, Federal Reserve Bank of St.Louis Working Paper 2007-016.

URL https://doi.org/10.20955/wp.2007.016

 

Observaciones

Estos algoritmos tienen un coste computacional muy superior, y su uso es poco habitual en la industria. Además, dado que el problema no es en general convexo, no hay un método de resolución estándar, se requieren algoritmos de búsqueda de soluciones como búsquedas estocásticas o búsquedas en barrido (grid search). Existen algunos RA que afirman usar alguna versión de full-scale optimization, pero en general no es habitual.

 

HRP

A pesar de que los algoritmos MVO del punto anterior tienen como objetivo crear carteras diversificadas, como ya hemos comentado tienden a generar carteras concentradas debido a tanto a la naturaleza de la optimización, como sobre todo a la sensibilidad al error de estimación de los parámetros.

HRP, llamado así por sus siglas en inglés Hierarchical Risk Parity14, 25, es un método de creación de carteras que incluye técnicas de machine learning (teoría de grafos y unsupervised machine learning), y que pretende conseguir las carteras más diversificadas posible. El método clasifica los activos en clusters siguiendo un criterio de semejanza basada en la correlación, y posteriormente selecciona el peso de cada cluster de forma inversamente proporcional a su riesgo. De este modo la aportación de volatilidad de los elementos se equilibra, de dónde proviene el término risk parity.

En optimizaciones como la de Markowitz, cada activo compite contra todo el universo de activos, de modo que si alguno de ellos tiene un valor extremo para el par rentabilidad-riesgo, se le asigna un peso muy elevado porque numéricamente mejora mucho la optimización, obteniendo carteras muy concentradas. Además, se ha observado estadísticamente, que estos valores extremos tienden a contener un error de estimación muy alto en comparación con otros activos con valores más moderados, de modo que el algoritmo optimiza dando un peso desproporcionado a los errores de estimación.
La ventaja de crear los clusters de activos con comportamiento similar antes de asignar pesos, es que los activos sólo compiten contra aquellos que se comportan de forma parecida a ellos y por tanto se conserva la diversificación respecto a activos que tienen comportamientos distintos.

 

Detalles del algoritmo

Construcción de clusters

La medida de semejanza se basa en la correlación entre los activos. Dos activos pertenecen al mismo cluster cuando su distancia definida como sigue es pequeña:

ρij correlación entre el activo i y el activo j

Dos activos pertenecen al mismo cluster cuando tienen una correlación parecida contra el resto de activos del universo, es decir, no se considera que dos activos son parecidos (pertenecen al mismo cluster) si tienen correlación alta entre ellos, si no si la correlación de cada uno de ellos con el resto de los activos es parecida.

La clasificación en clusters se empieza a nivel de activos, iterando posteriormente creando clusters de clusters que se van agrupando hasta que quedan dos únicos clusters.
Fuente: Predictive Hacks. “Dendogram hierarchical clustering” https://predictivehacks.com/hierarchical-clustering-in-python/

 

10.1.2. Asignación de pesos

Una vez se tienen construidos todos los clusters se

 

 

asignan los pesos de manera recursiva empezando por el cluster más grande (el último obtenido del proceso anterior). Cada cluster se divide en los dos que lo forman y se reasignan los pesos de manera inversamente proporcional a su riesgo (entendido como varianza). Empezando con todos los pesos Wi = 1, se ajustan los pesos como sigue.

 

 

σ1 i σ2 son la volatilidad de cluster 1 y 2 respectivamente.

 

Observaciones

  • El principio de HRP se puede usar con distintas métricas de riesgo y metodologías como volatilidad inversa o aportación de riesgo.
  • HRP es mucho más efectivo consiguiendo la diversificación que los métodos derivados de la teoría moderna de carteras gracias a la clasificación por clusters.
  • No requiere la estimación de retornos esperados dado que no intervienen en el algoritmo.

 

Casos de estudio

A continuación analizaremos varios de los principales roboadvisors del mercado, haciendo especial énfasis en los aspectos cuantitativos17, 18, entre los introducidos en el apartado anterior, aplicados en su modelo de gestión de carteras

Robo Advisor

AUMs*

Fees y mínimos

Algoritmo

Servicios Adicionales

Betterment

33,8bn

0,25% + costes producto subyacente (0,07%)

Mínimo 0$

Black-Litterman + CAPM + Fama-French 3 factor model + Monte Carlo + Ledoit and Wolf Shrinkage

  • Planificación financiera

  • Tax harvesting

  • Cuenta y tarjeta

  • Acceso a asesores humanos (mayor coste)

Wealthfront

22,8bn

0,25% + costes producto subyacente (0,08%)

Mínimo 500$

Black-Litterman + CAPM + APT (propio) + Ledoit and Wolf Shrinkage. AI Financial Planning

  • Planificación financiera avanzada con estimación de costes futuros, y estimación de pago de deuda

  • Tax harvesting

  • Cuenta y tarjeta

  • Préstamos

Charles Schwab

76,1bn

0 + costes producto subyacente (0,03%-0,18%)

Full-scale Optimization utilizando copulas en lugar de correlaciones y funciones de utilidad asimétricas para representar la aversión al riesgo (CVaR)

  • Tax harvesting

  • Parte de un grupo bancario (ofrece cuentas, acceso a asesores humanos, tarjetas etc, bajo el paraguas bancario

Vanguard

268bn

0,20% incluyendo el coste de los productos subyacentes

Markowitz + AI Financial Planning

  • Planificación financiera avanzada incluyendo estimación de pago de deuda, estimación de costes futuros

  • Acceso a asesores humanos (sin coste)

Indexa24

1,4bn

0,15%-0,43% según volumen + custodia (0,12%) + costes producto subyacente (0,08%)

Markowitz + Black Litterman

  • Tax harvesting

  • Seguros

Five Munich Re**

HRP (AI unsupervised machine learning)

 

Betterment

Betterment19,20 empieza el proceso definiendo los objetivos del cliente y su perfil de riesgo para construir una cartera utilizando MPT (modern portfolio theory de Markowitz).

 

Construcción de cartera

Universo de activos

Betterment utiliza lo que considera la cartera global de mercado de forma coherente con MPT, se centra en activos líquidos globales (bonos y renta variable) con algunas exclusiones:

  • Commodities por aportar casi nulo retorno ajustado al riesgo.
  • Reits por estar suficientemente representados en los índices de renta variable.

 

Estimación de los retornos de mercado

Estima los retornos futuros con CAPM (asumiendo que el mercado es eficiente).

Para estimar la matriz de covarianzas (necesaria para calcular las rentabilidades esperadas con el método CAPM) utiliza el método de shrinkage de Ledoit and Wolf15. Este método utiliza una combinación lineal de la matriz estimada por las observaciones históricas y una matriz objetivo estructurada (donde se sustituye la correlación entre los elementos por la correlación media entre todos los pares activos). La matriz resultante reduce considerablemente el error de estimación respecto a la calculada con datos históricos porque al utilizar la media como estimador objetivo reduce los valores extremos frutos de errores de estimación.

 

Black Litterman y Fama-French

Betterment utiliza el marco de inversión factorial de Eugene Fama y Kenneth French que sostiene que el retorno de una cartera se puede explicar por su exposición a los factores value y size además de su exposición al mercado (el riesgo explicado por CAPM).

Por ello Betterment sesga los portfolios a una mayor exposición a value y size para mejorar el retorno esperado de sus cartera. Utilizando BL y ajustando la confianza que tiene Betterment en la aportación de valor de estos factores para dar más o menos peso a estas visiones.

 

Monte Carlo

Una vez construida la cartera desde una perspectiva coherente con la teoría de eficiencia de mercado y del modelo Fama-French, Betterment realiza simulaciones del comportamiento de la cartera en distintos eventos de mercado (similar a full-scale optimization) para tener la seguridad de que toda la optimización anterior no resulta en un portfolio muy sensible a algún evento de mercado extremo.

 

Impuestos

Dentro del marco EMH (efficient market hypothesis), en general se desecha el efecto de los impuestos en el retorno de los inversores. Sin embargo, diferencias en las obligaciones impositivas de distintos clientes pueden provocar que la cartera eficiente para cada uno sea distinta. Por ejemplo, a menudo entidades gubernamentales en USA emiten municipals bonds cuyos rendimientos están libres de impuestos para los residentes de USA, pero que para los residentes de otro país, además de no estar libres de tributación en su país de residencia, tiene retenciones en origen. Esta diferencia puede suponer que el perfil rentabilidad riesgo de un activo cambie significativamente. Por ello Betterment tiene en cuenta la situación impositiva de cada cuenta optimizando su asignación de activos final incluyendo activos libres de impuestos en cuentas que pagan impuestos respecto aquellas que no tiene dichas obligaciones.

Dentro esta temática betterment también ofrece un algoritmo de tax-harvesting como el explicado en el apartado de optimización de impuestos de la sección anterior.

 

Wealthfront

Uno de los puntos fuertes de wealthfront22,23 es la planificación financiera avanzada y personalizada. Utiliza métodos de inteligencia artificial para clasificar los gastos de las cuentas corrientes de los clientes y entender sus patrones de gasto. Este tipo de clasificaciones también las ofrecen muchos bancos actualmente y servicios fintech como Fintonic. Pero Wealthfront combina esta información con las características de los objetivos del cliente, para establecer qué cantidad de dinero necesitan ahorrar. Por ejemplo, puede utilizar los patrones de gasto de un cliente para estimar cuánto dinero necesitará en su jubilación y por tanto cuánto debe ahorrar cada mes teniendo en cuenta su rentabilidad esperada basada en su perfil de riesgo. También se conecta a bases de datos externas para estimar el coste de una universidad concreta incluyendo costes como el alojamiento y diseñar un plan de ahorro e inversión para el cliente.

Otras funcionalidades incluyen el análisis de otras cuentas de inversión, o asesoramiento en cómo pagar deudas lo más eficientemente posible.

 

Construcción de cartera

Para construir la cartera Wealthfront utiliza prácticamente toda la teoría moderna de carteras de forma parecida a Betterment pero con algunas diferencias que se mencionan a continuación.

 

Universo de activos

Wealthfront incluye tres categorías de activos globales: renta variable, bonos y activos destinados a proteger de la inflación como bonos ligados a la inflación y, a diferencia de Betterment, materias primas e inmobiliario.

 

 Estimación de los retornos de mercado

Wealthfront utiliza como base CAPM para deducir la rentabilidad esperada por el mercado asumiendo la hipótesis de eficiencia de mercado. También utiliza un método de shrinkage utilizando el marco de Ledoit and Wolf15, pero la metodología está basada en una descomposición factorial estilo APT (se comentará dicha descomposición en el siguiente apartado):

  • Primero descomponen el comportamiento de los activos en función de una colección de factores para capturar las fuentes de variación comunes entre todos los activos y que representa el riesgo sistemático.
  • Calculan la matriz B que contiene la sensibilidad de cada activo respecto a cada factor (betas).
  • Una vez realizada esta descomposición factorial, calculan una matriz Σi que es la matriz de residuos de dicha descomposición y que representa el riesgo idiosincrático.
  • A continuación se calcula la matriz Σf de covarianza de los retornos de los factores en los que se ha descompuesto el comportamiento de los activos.
  • La matriz de covarianza es, lógicamente la suma de la descomposición factorial y su residuo, o lo que es lo mismo el riesgo sistemático (diversificable) y el riesgo idiosincrático (no diversificable):

  • Finalmente, se utiliza como estimador de la matriz de residuos la matriz diagonal que coincide con Σi en la diagonal. Esta simplificación tiene sentido teórico, pues si la descomposición factorial fuera perfecta no debería haber ningún tipo de covarianza residual en la matriz de riesgo idiosincrático.

 

Black Litterman y APT

Como hemos comentado, Wealthfront utiliza una descomposición factorial APT, pero en este caso es una metodología desarrollada internamente que descompone el comportamiento de un activo en distintos factores económicos como los tipos de interés o ratios de valoración. Esta descomposición es utilizada para hacer estimaciones del retorno futuro de los activos que se combinan con el vector de rentabilidades esperadas del mercado para crear un nuevo vector de rentabilidades esperadas utilizando BL.

 

Frontera eficiente

Finalmente buscan la frontera eficiente de la cartera para determinar la cartera óptima para cada nivel de riesgo. Para realizar esta optimización utilizan todo el trabajo previamente realizado para calcular la matriz de covarianzas y el vector de rentabilidades esperadas, sin embargo realizan también un ajuste a la rentabilidad para representarla neta de comisiones e impuestos.

También como en el caso de Betterment tienen en cuenta el tipo de cuenta del cliente al realizar ajustes de rentabilidad esperada por efecto de impuestos.

 

Charles Schwab

Schwab Intelligent Portfolios21 es un RA menos interesante en términos de planificación financiera que los dos anteriores, pero el algoritmo para construir la cartera que utiliza es de los más avanzados. Schwab utiliza el marco de optimización media varianza como principio pero la optimización se realiza con la metodología full-scale optimization.

 

Momentos de orden superior y cópulas

Schwab utiliza los momentos estadísticos de 3er (skewness) y 4º orden (kurtosis) a diferencia de los métodos MVO que solo utilizan el 1º (media) y 2º (varianza). A continuación se explica su significado:

  • Skewness: es una medida de asimetría de una distribución de probabilidad. Cuando un activo tiene skewness negativa significa que tiende a tener retornos positivos pequeños más a menudo de lo que una normal perfecta predeciría y pocos retornos negativos pero de magnitud más grandes que una normal. Positivo es el caso contrario. Muchos activos financieros tienen asimetría negativa por eso se observan crisis con grandes caídas seguidas de periodos con pequeñas pero frecuentes subidas.
  • Kurtosis: es una medida de eventos extremos en una distribución de probabilidad. Distribuciones con kurtosis alta implican mayor probabilidad de eventos extremos (tanto positivos como negativos). Cuando un activo tiene kurtosis altas se dice que tiene fat tails.

Además de utilizar momentos superiores, Schwab sustituye la correlación calculada como un valor fijo en el tiempo por una distribución de probabilidad (a diferencia de los métodos MVO que asumen que la correlación entre un par de activos es constante en el tiempo). Es conocido que la correlación varía en el tiempo, por ejemplo en tiempos de crisis económica algunos activos con baja correlación tienden a correlacionarse más y otros a descorrelacionarse. La técnica estadística utilizada para describir la interacción variable de los distintos activos en una cartera se llama cópula.

 

Función de utilidad y CVar

La volatilidad es una medida de variabilidad simétrica, es decir, se considera que una variación positiva o negativa es igual de perjudicial. Se sabe que los inversores tienen aversión al riesgo y su comportamiento no puede ser descrito por una medida simétrica. Schwab explica que para superar este problema utiliza el CVaR (Conditional Value at Risk).

El CVaR es una medida de riesgo asimétrica que se calcula como la media ponderada de pérdidas extremas una vez superado el VaR (Value at Risk). Es decir, es la pérdida media una vez nos situamos en un escenario extremo. Esta medida puede capturar mejor distribuciones de probabilidad que exhiben skewness y kurtosis, además de ser una medida asimétrica (más parecida al comportamiento del inversor).

Algunos papers afirman que Schwab utiliza una función de utilidad bilineal para representar el comportamiento del inversor (aversión al riesgo). Dicen deducirlo empíricamente a base de las optimizaciones que realiza el RA, sin embargo, Schwab no lo menciona en su metodología.

Ejemplo de función bilineal que modeliza el cambio de actitud de un inversor cuando entra en el terreno de las pérdidas.

Fuente: Best, M.J., Grauer, R.R., Hlouskova, J. et al. Loss-Aversion with Kinked Linear Utility Functions. Comput Econ 44, 45–65 (2014). https://doi.org/10.1007/s10614-013-9391-x

Fuente: Best, M.J., Grauer, R.R., Hlouskova, J. et al. Loss-Aversion with Kinked Linear Utility Functions. Comput Econ 44, 45–65 (2014). https://doi.org/10.1007/s10614-013-9391-x

Vanguard

Planificación financiera multiobjetivo

Vanguard Digital Advisor, el RA de Vanguard, utiliza otra variación de Markowitz para crear sus carteras de forma parecida a Wealthfront y Betterment, de modo que no vamos a explorar su proceso de construcción de carteras. Sin embargo, de forma parecida a Wealthfront, ha desarrollado un modelo de planificación financiera basado en inteligencia artificial (AI) bastante interesante. En la actualidad, el servicio completo de planificación mediante AI, solo está disponible para los clientes que optan por el servicio Vanguard Personal Advisor16, servicio que incluye visitas con asesores humanos (con un coste y mínimos superior al servicio puro de robo advisor), sin embargo, parte de las herramientas que los asesores de Vanguard utilizan están a disposición de los clientes de su RA para que puedan planificar sus objetivos incluyendo optimización del pago de deuda, objetivos de jubilación o compra de activos inmobiliarios.

El objetivo del algoritmo de planificación financiera de Vanguard es construir una estrategia de contribuciones a la cartera de inversión que optimice la probabilidad de que dicha cartera permita financiar la jubilación del cliente a la vez que financia objetivos prejubilación como la compra de activos inmobiliarios u otros bienes en distintos momentos de la vida del cliente.

La probabilidad de conseguir los distintos objetivos, varía en función de las aportaciones del cliente, la cartera elegida, las expectativas de retorno, la tolerancia al riesgo, los activos y pasivos del cliente (que aumentan o reducen su necesidad de ahorro) y sus ingresos y gastos (que determinan su aportación máxima en cada momento). Consecuentemente, las decisiones que hay que tomar en un momento concreto (cartera de inversión y aportación a la misma) dependen de la situación del resto de variables del problema. Este tipo de problemas en los que un agente debe tomar decisiones en función del estado del sistema, son adecuados para algoritmos de reinforcement learning (aprendizaje por refuerzo/recompensa que llamaremos RL)

Vanguard utiliza un tipo de algoritmos llamados DQN (deep Q Networks) que es uno de los algoritmos de RL más interesantes. A continuación resumimos su funcionamiento a alto nivel:

 

DQN

En general los problemas de RL requieren 5 elementos básicos:

  • Agente: es el algoritmo que se pretende construir
  • Medio ambiente: el entorno o problema con el que el agente interactúa
  • Estados: Normalmente representados por la letra S es la situación del medio ambiente o problema en un momento concreto, en el caso del problema de planificación financiera, un estado podría quedar definido el siguiente conjunto de datos (lista ilustrativa no exhaustiva):
    • Cantidad de dinero necesario para los distintos objetivos.
    • Tiempo hasta los distintos objetivos.
    • Valoración de la cartera más patrimonio neto del cliente (activo menos pasivos).
    • Expectativa de retorno y tolerancia al riesgo.
    • Cantidad máxima disponible para invertir.
  • Acciones: Normalmente representado por la letra A, es la lista de posibles acciones, en el caso del problema que nos ocupa, la aportación a realizar a la cartera.
  • Recompensas: es el refuerzo – positivo, negativo o 0 – que el agente recibe cuando realiza una acción y a partir del cual aprende.

 

Q-Table

El objetivo final del algoritmo de RL es crear una tabla (Q-table) donde cada fila es un estado posible del sistema y cada columna una acción posible. Por ejemplo, en el caso de un robot aspirador, podríamos tener tantas filas como cuadrados de 10cm2 existen en una habitación y 4 columnas correspondientes a moverse arriba, abajo, derecha o izquierda.

Los valores de la tabla describen la acción óptima para cada estado, de modo que dado un estado, buscamos la fila que representa dicho estado, y escogemos la acción (columna) que tiene el valor más alto.

 

Q-Values

El valor en cada uno de los elementos de la Q-table se llaman Q-values. Para obtener estos valores es necesario entrenar el sistema. Este entrenamiento funciona del siguiente modo:

  • Se inicializan todos los valores Qi en 0 y el sistema en un estado S1
  • El sistema realiza una acción aleatoria A1 y pasa al estado S2
  • El sistema recibe una recompensa R1
  • Se corrige Q1 en función de la recompensa más el valor Q máximo de las posibles acciones del siguiente estado S2.Ver ecuación a continuación:
Imagen: https://en.wikipedia.org/wiki/Q-learning

Imagen: https://en.wikipedia.org/wiki/Q-learning

 

La actualización del valor Q es una proporción (dada por el learning rate) entre su valor actual y la suma de la recompensa inmediata y el valor máximo del siguiente estado ponderado por el factor de descuento. El factor de descuento indica la importancia de la mejor acción del siguiente estado respecto a la recompensa inmediata.

 

Función ε-greedy

En el paso 2 del apartado anterior se ha dicho que el algoritmo realiza una acción aleatoria. Esto es así porque se busca que el algoritmo explore todas las opciones posibles (o por lo menos un subconjunto grande de todos los estados posible). Sin embargo, si durante la fase de calibración del algoritmo siempre utilizáramos acciones aleatorias y el problema es suficientemente largo y complejo (hay un gran número de pasos y opciones hasta el punto final), podríamos no llegar a explorar todas las cadenas de acciones posibles en un tiempo razonable. Para ello se define la función ε-greedy:

Fuente: Sajedian, Iman & Lee, Heon & Rho, Junsuk. (2019). Double-deep Q-learning to increase the efficiency of metasurface holograms. Scientific Reports. 9. 10899. 10.1038/s41598-019-47154-z.

Esta función decide en cada paso si la siguiente acción se toma de forma aleatoria o utilizando el valor Q más alto para el estado actual. Toma la opción aleatoria con probabilidad ε y la opción óptima con probabilidad 1-ε, aumentando dicho ε a medida que se van realizando iteraciones para favorecer que el modelo “avance” y explore soluciones cerca del resultado final.

 

Neural Network

El último escollo a superar es el hecho de que un problema puede tener demasiados estados (incluso infinitos) y por tanto la construcción de la Q-table puede no ser realista. Por ello se usa una red neuronal que aproxima el valor Q para un estado cualquiera al teórico valor que tendría en la Q-table. Las redes neuronales son especialmente adecuadas para estas tareas que consisten en reconocimiento de patrones.

Finalmente, una vez esta red neuronal ha convergido, se puede usar el algoritmo eligiendo en cada estado St la acción At que tiene el valor Qt máximo dado por la red neuronal.

 

Five

Es un producto de inversión de la aseguradora Munich Re26, similar a un RA, y es un caso interesante des del punto de vista de construcción de las carteras de inversión por utilizar el algoritmo HRP (Hierarchical Risk Parity).

Como se ha explicado en el apartado correspondiente a HRP el proceso tiene dos partes diferenciadas: construcción de los clusters y asignación de pesos.

Munich Re utiliza el método HRP para una cartera de Asset Allocation global con renta variable, renta fija de las principales regiones y metales preciosos. Como se puede observar el algoritmo agrupa clases de activos que se comportan de forma parecida, por ejemplo el oro y la plata, el STOXX Europe 600 y el DAX, etc. En sucesivos niveles agrupa toda la renta fija europea para agruparla finalmente con el resto de renta fija. De forma parecida agrupa la renta variable.

Fuente: Munich Re FIVE – Towards robust portfolios. "Los activos con un perfil de riesgo similar se agrupan. Se pueden observar dependencias regionales, por ejemplo S&P500, NASDAQ-100 and Russel 2000 or FTSE 100, SMI, STOXX Europe 600 and DAX forman clusters."

Fuente: Munich Re FIVE – Towards robust portfolios. “Los activos con un perfil de riesgo similar se agrupan. Se pueden observar dependencias regionales, por ejemplo S&P500, NASDAQ-100 and Russel 2000 or FTSE 100, SMI, STOXX Europe 600 and DAX forman clusters.”

 

Posteriormente se asignan los pesos de forma inversamente proporcional a su volatilidad respecto a la suma de volatilidades de los elementos del cluster. Se empieza por el cluster más grande y se va “bajando” siguiendo la bifurcaciones del dendrograma que divide cada cluster en dos subclusters hasta llegar a los activos finales. Así por ejemplo, el primer paso es asignar nuevos pesos a todos los activos que vienen del cluster rosa que contiene la RV de forma inversamente proporcional a su volatilidad conjunta respecto la volatilidad total, y uno de los últimos pasos sería recalcular el peso del oro y la plata.

Fuente: Munich Re FIVE – Towards robust portfolios. "Los pesos se distribuyen óptimamente en base a una asignación de peso inversa a la varianza"

Fuente: Munich Re FIVE – Towards robust portfolios. “Los pesos se distribuyen óptimamente en base a una asignación de peso inversa a la varianza”

 

Esta construcción asigna un mayor peso a los clusters que aportan poco riesgo y menor a los que aportan mucho, de modo que después de cada paso la aportación de riesgo de las dos ramas del cluster se equilibra. Por otro lado, debido a que los pesos se asignan entre elementos del mismo cluster y por tanto parecidos, los activos con baja correlación no compiten entre ellos y por tanto se favorece la diversificación.

 

Conclusiones

Los algoritmos de construcción de carteras de inversión presentados en este documento son una parte destacada de la tecnología que ha permitido la disrupción fintech que está experimentando el sector financiero de asesoramiento y gestión de inversiones.

Los casos revisados de roboadvisors líderes del mercado, muestran la evolución de los modelos financieros y de los métodos cuantitativos asociados, desde sus orígenes en la teoría de Markowitz de los años 1990s, hasta el uso actual de la inteligencia artificial. Este proceso de innovación sin duda va a continuar, combinado posiblemente con la tecnología en hardware y las aplicaciones de quantum computing (BBVA, 202128 y CaixaBank, 202229), y se seguirán creando nuevos modelos de negocio basados en la relación entre las finanzas, las matemáticas y la tecnología.

 

Referencias

  • BBC Global Asset Management, Lubasha Heredia et al, 2021. 100 Trillion Machine

  • The Robo Report, 2022

  • Robo-advisors, Policy Department for Economics, Scientific and Quality of Life Policies, ECON, 2021

  • Informa, Mayo 2021. Estudio Competitores de DBK, Banca Privada y Personal, 19a edición

  • ECON Committee, 2021. “Robo-advisors. How do they fit in the existing EU regulatory framework, in particular with regard to investor protection”

  • https://www.cnmv.es/portal/Fintech/Innovacion.aspx

  • Markowitz, H., “Portfolio Selection”.The Journal of Finance, Vol. 7, No. 1. (Mar., 1952), pp. 77-91.

  • Sharpe, W. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk, Journal of Finance, 19 (3), 425–442.

  • Black F. and Litterman R., Asset Allocation Combining Investor Views with Market Equilibrium, Journal of Fixed Income, Vol. 1, No. 2. (Sep., 1991), pp. 7-18. Black F. and Litterman R., Global Portfolio Optimization, Financial Analysts Journal, Vol. 48, No. 5 (Sep. – Oct., 1992), pp. 28-43.

  • Fama, E. and French, K., (1992). “The Cross-Section of Expected Stock Returns”. The Journal of Finance.47 (2): 427.

  • Ledoit, O. and Wolf, M., Honey, I Shrunk the Sample Covariance Matrix, Olivier Ledoit & Michael Wolf.

  • Mohammed, S., Bealer, R., & Cohen, J. (2021). Embracing advanced AI/ML to help investors achieve success: Vanguard Reinforcement Learning for Financial Goal Planning. arXiv preprint arXiv:2110.12003.

  • Beketov, Mikhail & Lehmann, Kevin & Wittke, Manuel. (2018). Robo Advisors: quantitative methods inside the robots. Journal of Asset Management. 19. 10.1057/s41260-018-0092-9.

  • Line Bjerknes, Ana Vukovic (2017). Automated Advice: A Portfolio Management Perspective on Robo-Advisors. NTNU

  • Wealthfront Investment Methodology White Paper

  • Cross Asset Portfolios of Tradable Risk Premia Indices, J.P.Morgan

  • FIVE Towards robust portfolios, Munich RE

  • Hagströmer, Björn and Anderson, Richard G. and Binner, Jane M. and Elger, Thomas and Nilsson, Birger, Mean-Variance vs. Full-Scale Optimization: Broad Evidence for the UK (May 2008). FRB of St. Louis Working Paper No. 2007-016D, Available at SSRN: https://ssrn.com/abstract=979811 or http://dx.doi.org/10.2139/ssrn.979811

  • BBVA, 2021. Dynamic Portfolio Optimization with Real Datasets Using Quantum Processors and Quantum-Inspired Tensor Networks

  • CaixaBank, 2022. “Grupo CaixaBank y D-Wave colaboran en innovadoras aplicaciones cuánticas para el sector financiero”

 

Sobre los autores:

Gerard Albà Soler es actualmente el Chief Investment Officer del grupo MoraBanc. Previamente, ha ocupado cargos directivos en diversas entidades financieras. Es licenciado en Matemáticas, analista financiero certificado, y con estudios de posgrado en finanzas cuantitativas, transformación digital, fintech e inteligencia artificial.

Arnau Vía Martínez-Seara es un emprendedor del sector Fintech. Previamente, ha ocupado distintos puestos, como el de director general de VallBanc Asset Management, y el de product manager en startups crypto, y en NTT Data. Es licenciado en Matemáticas, analista financiero certificado, y con estudios de posgrado en finanzas cuantitativas.